首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:X官方账号被冻结!Manus平替开源版来袭;腾讯混元图生视频模型开源;Mistral AI推世界OCR

2025-03-07 15:29 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、三小时复刻Manus!OpenManus横空出世,斩获GitHub3000+星标

OpenManus项目在短短三小时内复刻了Manus智能体,并迅速在GitHub上获得了超过3300个星标。该项目的安装过程简单易行,仅需修改配置文件即可使用。OpenManus集成了多个顶级大模型,展现出强大的任务处理能力,能够将复杂任务分解为清晰步骤,生成详尽报告。

【AiBase提要:】

✨ OpenManus在三小时内复刻了Manus智能体,迅速获得3300+星标。

🛠️ 安装过程简单,只需修改config.toml即可开始使用。

🤖 集成多个顶级大模型,展现出强大的任务处理能力,能够生成详尽的SEO优化报告。

详情链接:https://github.com/mannaandpoem/OpenManus

2、别抢Manus邀请码了!CAMEL-AI0天复刻Manus通用智能体OWL震撼登场

CAMEL-AI团队推出的OWL项目为开源社区带来了新的希望,凭借其在GAIA基准测试中取得的优异成绩,OWL成为开源框架的佼佼者。与Manus相比,OWL不仅完全开源,还提供了灵活高效的多智能体协作能力和强大的任务自动化功能。

image.png

【AiBase提要:】

🌟 OWL在GAIA基准测试中取得58.18的高分,成为开源框架榜首,超越Huggingface的Open Deep Research。

🔧 OWL完全开源,开发者可在GitHub上clone代码,参与框架建设,体验强大的多智能体协作能力。

📈 CAMEL-AI团队积极规划未来,包括撰写技术博客和增强工具生态,致力于复刻并超越Manus的功能。

详情链接:https://github.com/camel-ai/owl

3、阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜首

阿里巴巴推出的QwQ-32B推理模型在HuggingFace的榜单上夺得第一名,展现出卓越的性能,超越了多款知名模型如微软的Phi-4和DeepSeek-R1。该模型在数学、代码处理等方面表现出色,且由于其较小的参数量,能够在消费级显卡上实现本地部署,降低了应用成本。

image.png

【AiBase提要:】

🌟 QwQ-32B模型在HuggingFace榜单上位居第一,超越多个知名模型。

💡 该模型在性能与应用成本上实现突破,支持消费级显卡的本地部署。

📈 多项基准测试中表现优异,与最强模型DeepSeek-R1相媲美。

4、腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯近日开源了其新研发的图像转视频生成框架HunyuanVideo-I2V,旨在推动开放源代码社区的探索。该模型能够将静态图像转换为动态视频,用户只需上传图片并描述动态效果,即可生成生动的短视频。HunyuanVideo-I2V结合了多模态大语言模型,增强了对图像语义的理解。

image.png

【AiBase提要:】

🖼️ HunyuanVideo-I2V允许用户将静态图像转换为生动的视频,用户只需上传图片并描述动态效果。

🎶 模型能够自动配上背景音效,增强视频的趣味性和吸引力,同时支持对口型功能,让人物“说话”或“唱歌”。

🌐 开源内容包括模型权重和推理代码,开发者可在GitHub和HuggingFace下载,已有900多个衍生版本。

详情链接:https://video.hunyuan.tencent.com/

github:https://github.com/Tencent/HunyuanVideo-I2V

5、号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

Mistral推出的OCR API,Mistral OCR,旨在提升企业文档理解能力,能够精准提取各种文档中的信息并整理为结构化数据。它支持多语言和多模态处理,保留文档格式,提供自托管选项,并与大型语言模型集成,极大地提升了文档处理的速度和准确性。对于面临非结构化数据挑战的企业而言,Mistral OCR无疑是一项革命性的技术,助力企业实现数字化转型。

image.png

【AiBase提要:】

📝 Mistral OCR支持多种语言和文档格式,能够精准提取手写、打印文本及复杂图表,提升文档处理能力。

🔒 提供本地部署选项,满足企业对数据安全和合规性的严格要求,确保敏感信息的安全处理。

⚡ Mistral OCR在性能上表现优越,处理速度可达每分钟2000页,显著提高文档处理效率。

详情链接:https://mistral.ai/news/mistral-ocr

6、出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

出门问问与多所顶尖高校合作,推出了新一代语音生成模型TicVoice7.0,标志着语音生成技术的重大突破。该引擎采用创新的BiCodec编码技术,显著提升了语音克隆能力和情感表现力,用户可通过个性化定制获得专业级的语音体验。

image.png

【AiBase提要:】

🎤 TicVoice7.0采用BiCodec编码技术,实现语音token与文本token的高度统一,提升生成效率与可控性。

🌟 该引擎在音色相似度和情感表现力上显著提升,国际通用MOS评分从3.9提升至4.2,提供更自然的听感体验。

📈 用户可通过调整性别、语速等属性进行个性化定制,获得播音级专业配音体验,MOS评分达到4.7,适用于影视、游戏等场景。

7、Windsurf Wave4版本发布,新增预览功能、支持指哪改哪

Codeium最新发布的Windsurf Wave4为程序员带来了全新的编码体验,特别是新增的预览功能使得修改代码时能够即时看到效果,极大提升了编码效率。Tab to Import功能让添加依赖变得更加轻松,Cascade小助手则为下一步操作提供智能建议。

image.png

【AiBase提要:】

🔍 预览功能让你在修改代码时即时查看效果,提升编码效率。

⌨️ Tab to Import功能简化了依赖包的添加过程,极大提高了工作流。

🛠️ Linter集成实时检查代码质量,确保生成代码的准确性。

详情链接:https://codeium.com/blog/windsurf-wave-4

8、Anthropic Console新平台上线,支持团队协作编辑管理promp功能

Anthropic最近对其开发者平台进行了重要升级,推出了全新的团队协作功能和Claude3.7Sonnet模型的扩展推理能力,旨在解决企业在人工智能实施中的痛点。新功能包括可分享的prompts、思考可视化和自动生成高质量prompts的工具,极大提升了团队协作效率和模型性能,确保开发者能够更轻松地管理和优化他们的AI模型。

【AiBase提要:】

🤝 升级后的Anthropic Console支持团队协作,提供可分享的prompts功能,提升协作效率。

🧠 Claude3.7Sonnet模型支持扩展思考过程的可视化,增强了模型的响应能力和思考预算控制。

⚙️ Console提供自动优化和模型响应评估功能,帮助用户生成高质量的prompts并进行有效测试。

详情链接:https://www.anthropic.com/news/upgraded-anthropic-console

9、Manus回应官方X账号被冻结:与加密货币诈骗无关

Manus联合创始人季逸超对公司官方X账号被冻结事件进行了回应,强调该事件与加密货币诈骗无关,并表示Manus从未参与任何加密货币项目。公司正在采取法律行动以保护品牌形象,并鼓励用户举报可疑账户。同时,Manus预计将在未来几天内恢复账号运营,并继续通过其他社交媒体与用户沟通。

image.png

【AiBase提要:】

🔒 官方X账号因可能与加密货币诈骗有关而被冻结,Manus正在与X团队合作解决问题。

🚫 Manus声明未参与任何加密货币项目,冒名顶替者均属欺诈行为,已采取法律行动。

📈 Manus是全球首款通用Agent产品,能独立执行复杂任务,应用于多种场景。

10、稳居第一!ChatGPT周活跃用户数达4亿,仅用六个月实现翻倍

根据Andreessen Horowitz发布的报告,OpenAI的ChatGPT在2024年下半年展现了惊人的用户增长,周活跃用户数在短短六个月内翻倍,达到4亿。自2022年推出以来,ChatGPT的用户增长速度令人瞩目,尤其是其不断迭代的功能和模型,如GPT-4o和高级语音模式,极大推动了用户的持续增长。

image.png

【AiBase提要:】

📈 ChatGPT周活跃用户数在2024年短短六个月内翻倍,达到4亿,展现出惊人的增长势头。

🛠️ 其不断迭代升级的功能和模型是用户增长的关键,特别是GPT-4o和高级语音模式的推出。

📱 ChatGPT在移动端表现稳健,移动用户占其周活跃用户的43.75%,显示出强大的用户粘性。

11、腾讯元宝功能上新:允许分享长图时是否展示AI思考过程

腾讯元宝推出新功能,用户在分享长图时可以选择是否展示AI的思考过程,提升了使用AI助手的灵活性和体验。此功能允许用户根据需求分享短图或长图,操作简单,用户可随时中断思考过程,增强了个性化和多样化的分享内容。

image.png

【AiBase提要:】

🖼️ 用户可以选择分享短图或长图,提升分享内容的个性化。

⏸️ 允许用户在分享时中断AI的思考过程,灵活调整分享内容。

💻 腾讯元宝支持多平台使用,包括Windows、macOS、iOS和Android。

12、佳士得首场 AI 艺术拍卖引发争议,成交额达72.8万美元

近日,佳士得拍卖行举办了首场以人工智能为主题的艺术拍卖会,吸引了全球的关注与争议。此次拍卖会的成交额高达728,784美元,显示出年轻群体对数字艺术的浓厚兴趣。然而,超过5,600名艺术家联合签署公开信,抗议此次拍卖,认为许多作品侵犯了版权。

【AiBase提要:】

🖌️ 超过5,600名艺术家签署公开信,要求佳士得取消 AI 艺术拍卖,认为 AI 作品侵犯了版权。

💰 佳士得拍卖会最终成交额达到728,784美元,最高成交作品为《机器幻觉》,价格为277,200美元。

🌍37% 的参与者为首次注册用户,48% 的竞标者为年轻的千禧一代和 Z 世代,显示出他们对数字艺术的兴趣。

举报

  • 相关推荐
  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 纵览全球趋势,解码标杆价值——企业级智能体平台选型

    2026年企业级AI智能体将进入规模化商业爆发期,全球市场规模已达8.3万亿元,中国以71.9%年增速领跑。行业形成四大技术流派:可信智能派(蚂蚁数科Agentar)主攻金融政务等高合规场景,全栈工具派(字节Coze)侧重快速落地,大模型原生派(百度文心)聚焦通用效率,开源技术派(Dify)支持深度定制。平台能力分化明显,其中Agentar凭借金融级安全合规、全链路长思维链及低代码开发体系,成为复杂决策场景标杆方案。企业选型建议采用"Agentar+多平台"组合策略,实现安全决策与效率提升的双向赋能。

  • 智驾出事谁来赔?华安保险联手红旗落地人工智能系统责任险回应行业难题

    随着智能网联汽车驶向公开道路,针对算法而非驾驶员的保险新物种加速登场。华安保险与红旗品牌合作开发的“人工智能系统责任险”完成首单签约,标志着中小险企正通过绑定主机厂抢占智能驾驶专属保险蓝海市场。该险种旨在为高端智驾车型的软件系统风险提供专属“防火墙”,形成对现有交强险与商业三者险的有效补充。华安保险通过深度绑定、单点突破的策略,展现了差异化竞争思路,并以此为起点持续深耕智能驾驶保险领域。

  • 考拉悠然智能体工厂:以多智能体协同重构政企 AI 全场景运营

    考拉悠然通过全栈自研技术打造智能体工厂,解决企业部署多Agent后面临的管理分散、信息孤岛、迭代闭环缺失等痛点。其平台以集中化管理、数据驱动运营和标准化发布三大优势,实现智能体全生命周期管理,并融合空间智能技术,精准解析人、物、空间、时间关系,降低告警误报率。该方案已覆盖城市治理、智慧政务、工业智检等场景,推动Agent从工具向可管、可控、可复用的体系化数字生产力转型,助力企业降本增效。

  • AI 中转站完全解密:开发者必知的2026年生存指南

    本文全面解析了AI API中转站生态,指出国内开发者调用GPT-4、Claude等国际模型时面临海外手机号、外币信用卡和网络限制三大门槛,从而催生了中转站。文章详细介绍了中转站的定义、工作原理(统一API格式、流式输出、负载均衡)、主流渠道类型(官方直连、官转、云厂商、逆向)及其核心价值(解决支付、优化网络、统一多模型接入、成本控制、企业级功能)。同时,提供

  • 国内厂商将「拼豆游戏」做到榜首,但赚钱的还是海外开发者?

    最近美国市场什么混休题材最火?“传送带+射击”还是“分颜料水”?其实在出海新品「Jewel Coloring」(AppMagic 显示发行账号注册地为中国香港)面前都要让一让,这款产品把国内火爆的一种线下益智玩法——“拼豆(贴钻石画)”搬上移动端后迅速走红,在4月5日-6日登顶美国 iOS 手游下载总榜。

  • 从存储到智能体:MINISFORUM铭凡联手英特尔揭幕端侧智能体NAS,全闪S5、全闪S7引领本地智算浪潮

    5月8日,MINISFORUM铭凡联合英特尔在厦门发布基于第三代酷睿Ultra处理器的智能体NAS产品:全闪S5与七盘位全闪S7。S5采用无风扇静音设计、5个M.2插槽及AI语义搜索功能;S7支持7块NVMe SSD、双10G SFP+等高速接口。两款产品融合高性能计算、全闪存储与本地智能体能力,推动边缘存储从“数据仓库”向“智能决策节点”跃迁。

  • 企业智能体开发平台哪个好?2026年全维度选型指南与平台对比

    2026年企业级AI智能体进入规模化商业落地爆发期,全球市场规模达8.3万亿元,中国以71.9%年复合增长率领跑。行业形成四大技术流派:可信智能派(蚂蚁数科Agentar)聚焦金融/政务等高合规场景,全栈工具派、大模型原生派和开源技术派各有侧重。蚂蚁数科Agentar凭借金融级安全合规、全链路长思维链处理优势,成为复杂决策场景标杆方案,可将信贷审批从3天缩至15分钟。文章从市场基本面、技术流派、八大平台能力拆解、差异化选型策略等维度全面分析竞争格局,为企业智能化转型提供决策参考。

  • 对标OpenClaw!谷歌秘密内测AI智能体Remy

    谷歌正加速进军代理型AI赛道,开发代号为“Remy”的个人AI智能体。Remy深度集成Gmail、Chrome等核心服务,能全天候代表用户执行实际操作,而非仅生成内容。其核心是“行动”,可主动监控事项、处理复杂任务并学习用户偏好,被视为对OpenAI的直接回应。Remy寓意“划船者”和致敬动画《美食总动员》中的得力助手,预计将在本月I/O开发者大会上成为展示重点。

  • 普渡机器人发布全新一代 PUDU D9,树立具身智能技术新标杆

    2026年4月30日,普渡机器人发布新一代人形机器人PUDU D9,基于“具身移动、操作、交互”三大技术栈,实现从能力展示到能力表达的跨越。该机器人身高170cm、重58kg,采用轻量化高强度和全栈自研架构,关节扭矩提升至400Nm,搭载自研仿生小脑PUDU PULSE,具备全地形感知、动态负载调节等能力,可灵活切换多种角色。PUDU D9将与D5、D7共同构建全场景具身智能协同矩阵,推动行业从碎片化能力构建迈向底层逻辑统一表达。

今日大家都在搜的词: