首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:智谱Realtime、4V、Air系列模型发布;Vidu2.0上线10秒生成短片;xAI上线Grok网页版

2025-01-16 15:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Luma AI 推出Ray2视频生成模型,实现更快更自然的运动效果

Luma AI最近推出了Ray2视频生成模型,标志着在AI视频创作领域的重要进展。Ray2经过大量计算训练,提升了视频生成的速度和自然度,用户可以通过简单的文本描述生成短视频。尽管在复杂提示下可能出现失真,整体反馈积极。为了庆祝这一发布,Luma Labs还举办了大奖赛,鼓励创作者参与并有机会赢得奖金。

【AiBase提要:】

🌟 Ray2生成视频模型发布,提升视频创作效率和自然度。

🎥 支持文本到视频的快速生成,用户可轻松制作短视频。

💰 举办 Ray2大奖赛,创作者有机会赢得高达7000美元的奖金。

详情链接:https://lumalabs.ai/ray

2、马斯克旗下xAI上线Grok网页版 无需X账号即可体验

近日,埃隆·马斯克旗下的xAI公司推出了网页版Grok AI聊天机器人,用户无需访问X.com或拥有X账户即可体验其强大功能。只需在浏览器中访问grok.com并提供出生年份,用户便可立即使用这款智能聊天机器人。Grok AI不仅能实时收集信息和解答问题,还具备生成图像的能力,带来便捷的用户体验。

【AiBase提要:】

🌐 Grok AI网页版上线,用户无需X账户即可使用。

🤖 只需提供出生年份,便可体验智能聊天功能。

🔒 临时模式保护用户隐私,聊天内容不被记录。

3、智谱AI成首家被美国列入实体清单的中国大模型公司,回应称不受影响

智谱AI被美国商务部列入出口管制实体清单,成为首家被制裁的中国大模型公司。尽管面临制裁,智谱AI强调其技术源自清华大学,并表示制裁不会对其运营造成实质性影响。智谱AI在大模型技术领域持续创新,展现出强大的市场前景和技术实力。

【AiBase提要:】

📉 智谱AI成为首家被美国列入实体清单的中国大模型公司,标志着对中国AI产业的新一轮打压。

🔧 公司强调其技术源自清华大学,拥有全链路大模型核心技术,制裁不会影响正常运营。

📱 智谱AI正在与苹果洽谈合作,显示出其技术实力和市场前景。

4、阶跃星辰自研推理模型Step Reasoner mini上线

上海阶跃星辰智能科技有限公司推出了其自研的推理模型Step Reasoner mini(Step R-mini),该模型以其超长推理能力在逻辑推理、代码和数学等领域表现出色。Step R-mini通过大规模强化学习训练,能够兼顾文理科双向能力,展现了在复杂问题解决和内容创作上的卓越性能。

微信截图_20250116133149.png

【AiBase提要:】

🧠 Step R-mini是首个推理模型,擅长主动规划和反思,提供准确可靠的回复。

📊 在数学和逻辑推理任务中,Step R-mini展现出色的解题能力,能够处理复杂问题并提供多种解法。

🎨 该模型在内容创作中深入理解用户需求,具备创新表达风格,能够生成富有情感的文学作品。

详情链接:https://yuewen.cn

5、阿里巴巴Qwen 团队发布新型过程奖励模型,数学推理再进化

阿里巴巴 Qwen 团队最新发布的论文介绍了新型过程奖励模型(PRM)在数学推理中的应用,推出了 Qwen2.5-Math-PRM 系列模型,显著提升了推理的准确性和泛化能力。这些模型通过创新的共识过滤机制和蒙特卡洛估计,解决了传统方法在推理过程中的不足,尤其是在教育和科学计算等领域的应用前景广阔。

QQ20250116-104124.png

【AiBase提要:】

🔍 新模型突破了现有 PRM 框架的限制,显著提高了数学推理的准确性和泛化能力。

📊 采用共识过滤机制,有效降低了数据噪声约60%,提升了训练数据质量。

🚀 Qwen2.5-Math-PRM 系列在多个评估指标上表现优异,尤其在逐步识别错误的任务中超越了许多专有模型。

6、Kinetix 推出全新AI视频技术 可精准控制角色动作

Kinetix最近推出了一项创新的AI视频技术,能够通过结合真人表演和文本指令,实现对数字角色动作的精准控制。这项技术的操作流程简单易懂,用户无需专业的动画制作经验也能快速创作出高质量的动画内容。凭借强大的3D动画数据库支持和合成数据生成管道,Kinetix不仅大幅缩短了制作时间,还降低了成本。

image.png

【AiBase提要:】

🤖 通过结合真人表演视频和文本指令,Kinetix的AI技术实现了对数字角色动作的精确操控。

💡 系统支持多种动作和表情的精准捕捉,用户可调节动作的速度、幅度和节奏,提升角色表现效果。

⏱️ 制作时间从传统的数周缩短至数小时,降低制作成本,使中小型团队和个人创作者也能轻松实现专业动画。

详情链接:https://www.kinetix.tech/character-motion-control-for-video-generation-models

7、线稿上色的新技术MangaNinja:输入线稿和参考图,精准给线稿上色

MangaNinja是一种创新的线稿上色技术,通过输入线稿和参考图像,能够实现高精度的上色效果。该技术基于扩散模型,采用补丁重排模块和点驱动控制方案,显著提升了上色的准确性和图像质量。MangaNinja在处理复杂场景时表现出色,能够有效解决角色姿势变化和颜色混淆等问题,为用户提供了更大的创作灵感和可能性。

image.png

【AiBase提要:】

🌟 MangaNinja 是一种基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。

🎨 通过创新的补丁重排模块和点驱动控制方案,MangaNinja 显著提升了上色的准确性与图像质量。

🖌️ 该技术能够应对多样化的上色挑战,包括极端姿势和多参考图像的协调,实现高质量的互动上色体验。

详情链接:https://johanan528.github.io/MangaNinjia/

8、微软AutoGen v0.4发布:AI 智能体灵活性和跨语言能力大提升

微软最新发布的AutoGen v0.4版本显著提升了AI代理的灵活性和可控性,解决了用户在使用过程中遇到的架构限制和效率低下的问题。新版本引入的异步消息传递机制和跨语言互操作性,使得开发者可以更方便地构建复杂的代理网络。

image.png

【AiBase提要:】

💡 AutoGen v0.4版本增强了 AI 代理的灵活性,解决了用户反馈的问题。

🌐 新版支持异步消息传递和跨语言互操作性,提升了代理之间的协作能力。

🔧 AutoGen Studio 低代码界面的升级,使得用户可以更方便地设计和管理代理。

详情链接:https://www.microsoft.com/en-us/research/blog/autogen-v0-4-reimagining-the-foundation-of-agentic-ai-for-scale-extensibility-and-robustness/

9、腾讯会议全新升级 上线AI小助手Pro

腾讯会议近期推出了AI小助手Pro,基于腾讯混元千亿级参数大模型,具备深度理解和快速响应的能力,能够为用户提供精准的会议支持。此次升级还优化了组织协同功能,提升了会议效率,用户可以更方便地管理会议通知和录制分享。同时,新增的个人身份认证和企业认证功能也增强了会议的专业性与安全性。

image.png

【AiBase提要:】

🤖 AI小助手Pro支持联网搜索和多种任务处理,能深度理解会议内容,提供精准回答。

📅 用户可在会议中直接创建组织,快速添加参会者,提升会议效率。

🔒 新增身份认证功能,增强会议安全性和专业性,提升用户体验。

10、一家初创公司用AI智能体在Reddit大肆刷推广帖 还让人毫无察觉

最近,Astral创业公司因利用AI技术在Reddit上发布广告而备受关注。创始人萨瓦娜·费德展示了这项技术的快速应用能力,能够生成与用户讨论相似的内容,从而推销客户的产品。这种手法不仅高效,还能在不被察觉的情况下插入广告信息,引发了人们对网络空间未来的担忧,传统互联网可能被无休止的商业化和垃圾信息所侵蚀。

image.png

【AiBase提要:】

💡 Astral利用AI技术在Reddit上迅速生成用户相似的广告帖子。

📈 创始人设计AI代理绕过Reddit限制,专注于商业推广而非用户服务。

🚨 此举引发对网络内容未来的担忧,社交媒体可能充斥广告与垃圾信息。

11.智谱发布 GLM-4-Air、GLM-4V-Plus 模型,设立 Flash 全模态免费模型

智谱华章科技公司发布新模型 GLM-4-Air 和 GLM-4V-Plus,并推出全新端到端模型 GLM-Realtime,实现低延迟的视频理解和语音交互。该公司致力于提供高性价比的语言模型解决方案,并设立 Flash 全模态免费模型,支持多种应用场景,助力开发者创新。

图片

【AiBase 提要:】

🌟 推出 GLM-Realtime,具备清唱功能和 2 分钟记忆能力。

💡 GLM-4-Air-0111 全面升级,降低应用门槛至原来 50%。

📈 Flash 全模态免费模型系列,支持多模态理解和生成。

项目入口:bigmodel.cn

12.Vidu2. 0 正式上线10 秒生成短片,主体一致性效果更佳

Vidu 视频大模型正式发布 2.0 版本,生成短片的速度从 30 秒缩短至 10 秒,效率提升三倍。新版本优化了视频质量,保证了风格和主体的一致性,首尾过渡自然流畅。Vidu2.0 还推出超值套餐,降低了创作成本,并支持批量生成和本地支付,进一步便利用户。

QQ20250115-170654.jpg

【AiBase 提要:】

🎥 Vidu2.0 将短视频生成时间从 30 秒缩短至 10 秒。

💡 新版本在视频质量和一致性上进行了全面优化。

💰 超值套餐和本地支付提升了用户创作体验。

举报

  • 相关推荐
  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。