ModelScope由阿里巴巴达摩院推出,是一个集模型探索、推理、训练、部署及应用于一体的开源“模型即服务”(Model-as-a-Serv…
有时候,最强大的工具反而最纯粹。Whisper就是这样一个存在。它由创造了ChatGPT的OpenAI推出,是一个极其强大的自动语音识别(A…
音乐创作,现在可以以“秒”为单位。DiffRhythm(中文名:谛韵)是首个基于潜在扩散模型(Latent Diffusion)的歌曲生成模…
Genmo 正在重新定义视频创作的边界,它的目标是让任何人都能将脑海中的画面,无论现实或虚幻,都转化为生动的视频。作为一家前沿的AI实验室,…
让蒙娜丽莎开口唱歌,让家里的宠物开口说话,这不再是天方夜谭。由阿里巴巴、高德地图与北京邮电大学联合研发的 FantasyTalking 项目…
视频生成的游戏规则正在被改写。Open-Sora2.0,一个由中国潞晨科技发起的开源项目,正在将顶尖的视频生成技术带给每一个人。这个项目最令…
Stability AI 是引爆了AI绘画变革的幕后推手,那款大名鼎鼎的开源模型 Stable Diffusion 正是出自它手。但它的雄心…
Stable Video 是 AI 绘画巨头 Stability AI 迈向动态世界的第一步,它基于大名鼎鼎的 Stable Diffusi…
AI视频生成的赛道上,又来了一位重量级选手。Wan,这个由阿里巴巴通义实验室倾力打造的AI视频生成大模型,不仅性能强大到在多项权威评测中超越…
Stable Diffusion是AI图像生成领域的一座里程碑。它不是一个简单的应用,而是一个强大的底层模型,能够将文字描述转化为细节丰富、…
寻找高质量、可编辑SVG素材的难题有了新答案。OmniSVG不是简单地生成小图标,而是能从零开始创造复杂的动漫角色和精致插图。OmniSVG…
美团带着秘密武器LongCat来了。它拥有一个惊人的5600亿参数规模,但运行时却非常聪明,每次只激活一小部分“专家”参与工作。这个设计思路…
仅有320亿参数,性能却能超越规模大其20倍的旗舰模型,AI推理的规则正在被来自阿联酋的K2 Think重新定义。K2 Think的运行速度…