首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:腾讯深度思考模型“混元T1”全面开放;字节跳动全新视频生成工具Phantom;苹果智能将于4月初支持简体中文

2025-02-20 15:16 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯深度思考模型「混元T1」面向所有用户开放

腾讯正式宣布其深度思考模型「混元T1」现已全面向所有用户开放,用户可通过腾讯元宝平台体验该模型。此前在灰度测试阶段,混元T1获得了用户的积极反馈。该模型具备理解多重维度和潜在逻辑关系的能力,适合处理复杂任务。同时,用户还可以体验其他AI模型,如DeepSeek-R1满血版和腾讯混元Turbo。image.png

【AiBase提要:】

🆕 混元T1现已全面开放,所有用户可无限量使用,满足多样化需求。

🤖 用户可在腾讯元宝平台上体验多种AI模型,包括DeepSeek-R1和腾讯混元Turbo。

🌐 此次开放进一步丰富了腾讯元宝平台的AI模型生态,推动AI技术的普惠化。

2、xAI称已面向所有用户免费提供 Grok3直到他们服务器崩溃

xAI于2月20日宣布推出其最新AI模型Grok3,并声称其为世界上最聪明的AI。Grok3现已免费向公众开放试用,直到服务器崩溃。该模型引入了DeepSearch和Think两个新功能,分别增强了信息综合和推理能力。xAI强调Grok3在推理、数学和编程等任务中表现优异,并将在不久后通过API向开发者提供标准版和推理版。

【AiBase提要:】

🚀: Grok3被称为世界最聪明的AI,现已免费向公众开放试用。

🔍新功能DeepSearch能够快速综合信息,提升推理能力。

💻xAI将通过API发布Grok3的标准版和推理版,支持开发者使用。

3、AI大语言模型幻觉排行榜:Gemini2.0Flash幻觉最低

近日,Vectara发布的“幻觉排行榜”报告揭示了不同大型语言模型在文档摘要中的表现,特别是幻觉率和事实一致性。谷歌的Gemini2.0系列表现突出,尤其是Gemini-2.0-Flash-001以0.7%的低幻觉率位居榜首,显示出其在信息处理上的高效性。尽管一些模型的幻觉率有所上升,但大部分仍保持在较低水平,且应答率接近100%,表明它们在理解和回应问题时表现出色。

image.png

【AiBase提要:】

🌟 最新幻觉排行榜评估了不同大型语言模型在文档摘要中的表现。

🔍 谷歌Gemini系列模型表现突出,幻觉率低至0.7%。

📊 模型的应答率接近100%,显示出其在信息处理上的高效性。

详情链接:https://github.com/vectara/hallucination-leaderboard

4、昆仑万维旗下Opera接入DeepSeek R1模型 支持本地个性化部署

2月17日,昆仑万维旗下的Opera团队在Opera Developer中接入了DeepSeek R1系列模型,标志着Opera在AI技术应用方面的进一步拓展。用户可通过简单步骤在本地运行该模型,提升浏览器的AI能力。此次更新不仅为用户提供了更强大的本地AI功能,也展示了昆仑万维在AI技术领域的持续创新和应用能力。

【AiBase提要:】

🆕 Opera Developer接入DeepSeek R1模型,实现本地个性化部署,提升AI功能。

🌐 Opera率先在Web浏览器中引入本地大语言模型,支持超过50种LLM访问。

⚙️ 用户可根据设备能力选择合适的DeepSeek R1模型,享受个性化AI体验。

5、谷歌发布全新视觉语言模型 PaliGemma2Mix 集成多种功能助力开发者

谷歌最近推出了PaliGemma2Mix,这是一款全新的视觉-语言模型,结合了图像处理和自然语言处理的能力,能够理解视觉信息与文本输入,并生成相应的输出。该模型支持多种视觉-语言任务,如图像描述、OCR、图像问答等,适用于多种应用场景。

image.png

【AiBase提要:】

🖼️ PaliGemma2Mix集成图像描述、OCR、图像问答等多种任务,提升多任务处理能力。

🔍 开发者可选择3B、10B和28B三种参数规模,适应不同计算资源与需求。

📥 模型的混合权重可在Kaggle和Hugging Face下载,方便开发者进行实验与开发。

详情链接:https://arxiv.org/abs/2412.03555

6、iPhone16e配备8GB内存 苹果智能四月将增加中文支持

苹果公司今日正式发布了新款手机iPhone16e,搭载8GB内存,符合市场预期并满足Apple Intelligence功能的要求。iPhone16e将于2月21日开始预购,2月28日正式发售,国行售价4499元起,旨在让更多消费者体验苹果的最新科技。此外,苹果计划在4月初推出新的Apple Intelligence功能及多种语言支持,包括简体中文。

image.png

【AiBase提要:】

📅 iPhone16e将于2月21日开始预购,2月28日正式发售,售价4499元起。

⚙️ 该机型搭载8GB内存,提升了性能,为用户提供更流畅的体验。

🌐 苹果计划在4月推出新的Apple Intelligence功能,支持多种语言,包括简体中文。

7、微软团队推多模态AI模型Magma:整合视觉、语言和动作决策技能

微软研究团队与多所高校的研究人员共同推出了名为“Magma”的多模态AI模型,旨在整合图像、文本和视频等多种数据类型,以便在数字与物理环境中执行复杂任务。Magma通过强大的训练方法和创新技术,克服了现有AI模型在跨领域应用中的局限性,展现出卓越的多模态理解和空间推理能力。

image.png

【AiBase提要:】

🌟 Magma模型经过3900万多样本训练,具备强大的多模态学习能力。

🤖 该模型成功整合视觉、语言和行动,克服了现有AI模型的局限性。

📈 Magma在多项基准测试中表现出色,显示出较强的泛化能力和优异的决策执行能力。

详情链接:https://microsoft.github.io/Magma/

8、Xbox推新生成AI模型Muse,助力游戏开发者高效创建游戏元素

微软推出的生成性人工智能模型Muse旨在提升游戏开发者的创作效率。该模型通过深度学习理解3D游戏世界,能够实时生成游戏元素并响应玩家行为。然而,游戏开发者对Muse的发布表示担忧,认为AI可能削弱创作自由。尽管如此,微软依然对Muse的潜力充满信心,期待其为游戏行业带来更多创新和丰富的体验。

image.png

【AiBase提要:】

🌟 Muse是微软最新的生成AI模型,旨在帮助游戏开发者提高创作效率。

🎮 游戏开发者对Muse的发布表示怀疑,担心AI会影响创作自由。

🔍 微软相信Muse能够提升游戏体验,尽管业界对此反应不一。

详情链接:https://news.xbox.com/en-us/2025/02/19/muse-ai-xbox-empowering-creators-and-players/

9、警惕!马斯克的新AI模型Grok3被曝存在严重安全漏洞,黑客可轻松操控!

Adversa AI发布的报告揭示,马斯克的Grok3模型在网络安全方面存在重大漏洞,易受攻击者操控。研究显示,该模型在面对越狱攻击时的防御能力较弱,甚至不及一些中国的AI模型。若不及时修复这些漏洞,未来可能导致AI代理在执行任务时产生严重安全隐患,给用户带来巨大的风险。

【AiBase提要:】

🚨 Grok3模型被发现存在严重的网络安全漏洞,容易受到攻击者的操控。

🛡️ 研究表明,该模型在面对越狱攻击时的防御能力较弱,甚至不如一些中国的AI模型。

⚠️ 如果这些漏洞不被修复,未来可能导致AI代理在执行任务时产生安全隐患。

10、Mistral的AI助手Le Chat两周内下载量突破百万

Mistral近期发布的AI助手Le Chat在上线两周内便突破了100万次下载,受到广泛关注。法国总统马克龙公开支持该应用,鼓励民众选择Le Chat而非OpenAI的ChatGPT。这一成就不仅反映了Le Chat的技术竞争力,也得益于政策支持和市场环境的推动。

【AiBase提要:】

📈 Le Chat在上线两周内下载量突破100万次,迅速成为免费应用下载榜首。

🇫🇷 法国总统马克龙公开支持Le Chat,鼓励民众选择该应用,增强了其市场影响力。

🤖 面对谷歌和微软等竞争对手,Mistral的Le Chat展示了AI助手的巨大市场潜力。

11.视频创作神器再升级!字节跳动 “Phantom” 炸场,主体复制粘贴,细节神还原

字节跳动推出全新视频生成工具 “Phantom”,主打 “参考主体生成” 功能,支持单主体和多主体的复杂场景。该工具能够精准捕捉和复刻人物、物品等细节,提升视频创作效率与自由度,几乎看不出 AI 合成痕迹,令人惊叹。Phantom 具备广泛应用场景,可以生成不同风格和复杂动作的视频。

【AiBase 提要:】

🎥 Phantom 支持主体复制粘贴,极大提升视频创作效率。

✨ 主体一致性表现出色,细节几乎不显 AI 痕迹。

🌟 广泛应用场景,支持多种风格和复杂互动生成。

12、中小团队提效 AI 助手 HiveChat,支持 Claude、Deepseek 等多个 AI 模型

HiveChat 是 HiveNexus 推出的一款 AI 聊天应用,旨在提升中小团队的协作效率。它支持多种 AI 模型,如 Deepseek 和 Claude,用户可通过简单注册使用。管理员可进行多项管理设置,包括配置 AI 模型和用户管理,确保团队沟通的顺畅。同时,HiveChat 具备图像理解能力,支持专业内容展示与数据存储,保障用户信息安全。

QQ_1740037485014.png

【AiBase 提要:】

🔧 HiveChat 专为中小团队设计,提高沟通和协作效率。

🤖 支持多种 AI 模型,提供个性化的聊天体验。

🔒 提供云端数据存储,确保用户信息安全与便捷。

项目入口:https://github.com/HiveNexus/HiveChat

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。