11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。
本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。
视觉中国宣布与北京生数科技有限公司建立战略合作关系,双方将基于各自的技术优势和行业资源,共同探索并建立“视觉产业大模型平台及应用”。此次合作旨在深化人工智能技术在视觉内容产业的应用,推动产业智能化升级,为全球视觉内容创作者和使用者提供更高效、智能的服务。通过双方的深度合作与共同努力,将开拓更多前沿的AI应用领域,共同打造互利共赢的产业生态,引领视觉内容产业迈向智能化新时代。
生数科技完成数亿元Pre-A轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投等数位老股东继续支持。生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。2022年提出了Diffusion与Transformer融合架构U-ViT,进一步开源了多模态扩散模型UniDiffuser,验证了大规模训练融合架构的可行性和效果。
生数科技「多模态大模型」正式通过国家《生成式人工智能服务管理暂行办法》备案。成立于2023年3月,生数科技是一家全球领先的自主研发多模态通用大模型的人工智能企业,布局MaaS与应用级产品,面向艺术设计、游戏制作、影视动画、社交娱乐等领域提供赋能。生数科技将继续深化在通用多模态大模型方向的探索,致力于用AI提升每个人的创造力和生产力。
生数科技是一家成立于2023年的公司,专注于多模态大模型的研发,包括图像、3D和视频等多种原生多模态大模型。他们的团队来自清华大学人工智能研究院和其他科技公司,拥有深厚的技术背景。公司还计划持续优化基础模型,特别是在长视频生成能力方面进行突破,并探索全新产品形态,致力于提升用户创造力和生产力。
生数科技宣布AI绘画平台PixWeaver正式开启公测。该平台具有高效创作的特点,平均生成每张图仅需3秒,用户无需等待。其简单易用的操作界面和强大的功能将为用户带来全新的创意体验。
北京生数科技有限公司完成了数千万元天使轮融资,本轮融资由锦秋基金独家投资。此轮资金将主要用于算法研发、产品开发和团队扩充。生数科技现阶段已实现了百亿数据、数十亿参数规模的模型内测,并在多种模态任务中实现了国际领先的效果,例如图像生成在语义理解准确度、画面联想丰富度等方面优于业内同类模型;3D模型生成在多样性和精细度上取得极佳突破,达到业内最接近商业落地的生成水准;视频生成能实现可控的内容改写与风格迁移,效果优于Runway等在内的主流模型。
AI创企北京生数科技有限公司宣布完成近亿元人民币的天使轮融资,本轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前估值已达1亿美金。本轮融资后续将主要用于核心研发团队的建设,加速多模态大模型和应用产品的研发。目前该大模型正在快速迭代中,现阶段已于图像生成、3D内容生成、视频生成等任务中实现全球范围内超高水平的生成效果。