11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。
腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。
百度联合复旦大学等发布Hallo2,一个可以生成长达数小时且分辨率为4K的人物动画的视觉模型。Hallo2目前已经在GitHub平台开源,供全球开发者免费使用和研究,预计将促进视频生成技术的广泛应用和发展。大会目前已开放免费报名通道,可通过大会官网报名参会。
VQAScore是一种新的评估指标,旨在更好地评估复杂的文本到视觉生成效果。这一指标结合了CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中实现最佳性能,是评估和优化文本到视觉生成模型的强大工具。如果您希望了解更多信息并开始使用VQAScore进行评估,请访问VQAScore官方网站。
VAR是一种新的视觉自回归建模方法,能够超越扩散模型,实现更高效的图像生成。它建立了视觉生成的幂律scalinglaws,并具备零shots的泛化能力。想要了解更多关于VAR的信息并开始您的图像生成之旅,请访问VAR官方网站。
HiDream.ai创始人梅涛在接受AI科技评论采访时表示,做一家对标MJ和SD的公司,比扎堆做LLM机会更大。梅涛曾在微软和京东工作多年,积累了丰富的技术和商业经验。他们对标国外公司,致力于打造一个具有全球影响力的创新型公司。