首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:X官方账号被冻结!Manus平替开源版来袭;腾讯混元图生视频模型开源;Mistral AI推世界OCR

2025-03-07 15:29 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、三小时复刻Manus!OpenManus横空出世,斩获GitHub3000+星标

OpenManus项目在短短三小时内复刻了Manus智能体,并迅速在GitHub上获得了超过3300个星标。该项目的安装过程简单易行,仅需修改配置文件即可使用。OpenManus集成了多个顶级大模型,展现出强大的任务处理能力,能够将复杂任务分解为清晰步骤,生成详尽报告。

【AiBase提要:】

✨ OpenManus在三小时内复刻了Manus智能体,迅速获得3300+星标。

🛠️ 安装过程简单,只需修改config.toml即可开始使用。

🤖 集成多个顶级大模型,展现出强大的任务处理能力,能够生成详尽的SEO优化报告。

详情链接:https://github.com/mannaandpoem/OpenManus

2、别抢Manus邀请码了!CAMEL-AI0天复刻Manus通用智能体OWL震撼登场

CAMEL-AI团队推出的OWL项目为开源社区带来了新的希望,凭借其在GAIA基准测试中取得的优异成绩,OWL成为开源框架的佼佼者。与Manus相比,OWL不仅完全开源,还提供了灵活高效的多智能体协作能力和强大的任务自动化功能。

image.png

【AiBase提要:】

🌟 OWL在GAIA基准测试中取得58.18的高分,成为开源框架榜首,超越Huggingface的Open Deep Research。

🔧 OWL完全开源,开发者可在GitHub上clone代码,参与框架建设,体验强大的多智能体协作能力。

📈 CAMEL-AI团队积极规划未来,包括撰写技术博客和增强工具生态,致力于复刻并超越Manus的功能。

详情链接:https://github.com/camel-ai/owl

3、阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜首

阿里巴巴推出的QwQ-32B推理模型在HuggingFace的榜单上夺得第一名,展现出卓越的性能,超越了多款知名模型如微软的Phi-4和DeepSeek-R1。该模型在数学、代码处理等方面表现出色,且由于其较小的参数量,能够在消费级显卡上实现本地部署,降低了应用成本。

image.png

【AiBase提要:】

🌟 QwQ-32B模型在HuggingFace榜单上位居第一,超越多个知名模型。

💡 该模型在性能与应用成本上实现突破,支持消费级显卡的本地部署。

📈 多项基准测试中表现优异,与最强模型DeepSeek-R1相媲美。

4、腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯近日开源了其新研发的图像转视频生成框架HunyuanVideo-I2V,旨在推动开放源代码社区的探索。该模型能够将静态图像转换为动态视频,用户只需上传图片并描述动态效果,即可生成生动的短视频。HunyuanVideo-I2V结合了多模态大语言模型,增强了对图像语义的理解。

image.png

【AiBase提要:】

🖼️ HunyuanVideo-I2V允许用户将静态图像转换为生动的视频,用户只需上传图片并描述动态效果。

🎶 模型能够自动配上背景音效,增强视频的趣味性和吸引力,同时支持对口型功能,让人物“说话”或“唱歌”。

🌐 开源内容包括模型权重和推理代码,开发者可在GitHub和HuggingFace下载,已有900多个衍生版本。

详情链接:https://video.hunyuan.tencent.com/

github:https://github.com/Tencent/HunyuanVideo-I2V

5、号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

Mistral推出的OCR API,Mistral OCR,旨在提升企业文档理解能力,能够精准提取各种文档中的信息并整理为结构化数据。它支持多语言和多模态处理,保留文档格式,提供自托管选项,并与大型语言模型集成,极大地提升了文档处理的速度和准确性。对于面临非结构化数据挑战的企业而言,Mistral OCR无疑是一项革命性的技术,助力企业实现数字化转型。

image.png

【AiBase提要:】

📝 Mistral OCR支持多种语言和文档格式,能够精准提取手写、打印文本及复杂图表,提升文档处理能力。

🔒 提供本地部署选项,满足企业对数据安全和合规性的严格要求,确保敏感信息的安全处理。

⚡ Mistral OCR在性能上表现优越,处理速度可达每分钟2000页,显著提高文档处理效率。

详情链接:https://mistral.ai/news/mistral-ocr

6、出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

出门问问与多所顶尖高校合作,推出了新一代语音生成模型TicVoice7.0,标志着语音生成技术的重大突破。该引擎采用创新的BiCodec编码技术,显著提升了语音克隆能力和情感表现力,用户可通过个性化定制获得专业级的语音体验。

image.png

【AiBase提要:】

🎤 TicVoice7.0采用BiCodec编码技术,实现语音token与文本token的高度统一,提升生成效率与可控性。

🌟 该引擎在音色相似度和情感表现力上显著提升,国际通用MOS评分从3.9提升至4.2,提供更自然的听感体验。

📈 用户可通过调整性别、语速等属性进行个性化定制,获得播音级专业配音体验,MOS评分达到4.7,适用于影视、游戏等场景。

7、Windsurf Wave4版本发布,新增预览功能、支持指哪改哪

Codeium最新发布的Windsurf Wave4为程序员带来了全新的编码体验,特别是新增的预览功能使得修改代码时能够即时看到效果,极大提升了编码效率。Tab to Import功能让添加依赖变得更加轻松,Cascade小助手则为下一步操作提供智能建议。

image.png

【AiBase提要:】

🔍 预览功能让你在修改代码时即时查看效果,提升编码效率。

⌨️ Tab to Import功能简化了依赖包的添加过程,极大提高了工作流。

🛠️ Linter集成实时检查代码质量,确保生成代码的准确性。

详情链接:https://codeium.com/blog/windsurf-wave-4

8、Anthropic Console新平台上线,支持团队协作编辑管理promp功能

Anthropic最近对其开发者平台进行了重要升级,推出了全新的团队协作功能和Claude3.7Sonnet模型的扩展推理能力,旨在解决企业在人工智能实施中的痛点。新功能包括可分享的prompts、思考可视化和自动生成高质量prompts的工具,极大提升了团队协作效率和模型性能,确保开发者能够更轻松地管理和优化他们的AI模型。

【AiBase提要:】

🤝 升级后的Anthropic Console支持团队协作,提供可分享的prompts功能,提升协作效率。

🧠 Claude3.7Sonnet模型支持扩展思考过程的可视化,增强了模型的响应能力和思考预算控制。

⚙️ Console提供自动优化和模型响应评估功能,帮助用户生成高质量的prompts并进行有效测试。

详情链接:https://www.anthropic.com/news/upgraded-anthropic-console

9、Manus回应官方X账号被冻结:与加密货币诈骗无关

Manus联合创始人季逸超对公司官方X账号被冻结事件进行了回应,强调该事件与加密货币诈骗无关,并表示Manus从未参与任何加密货币项目。公司正在采取法律行动以保护品牌形象,并鼓励用户举报可疑账户。同时,Manus预计将在未来几天内恢复账号运营,并继续通过其他社交媒体与用户沟通。

image.png

【AiBase提要:】

🔒 官方X账号因可能与加密货币诈骗有关而被冻结,Manus正在与X团队合作解决问题。

🚫 Manus声明未参与任何加密货币项目,冒名顶替者均属欺诈行为,已采取法律行动。

📈 Manus是全球首款通用Agent产品,能独立执行复杂任务,应用于多种场景。

10、稳居第一!ChatGPT周活跃用户数达4亿,仅用六个月实现翻倍

根据Andreessen Horowitz发布的报告,OpenAI的ChatGPT在2024年下半年展现了惊人的用户增长,周活跃用户数在短短六个月内翻倍,达到4亿。自2022年推出以来,ChatGPT的用户增长速度令人瞩目,尤其是其不断迭代的功能和模型,如GPT-4o和高级语音模式,极大推动了用户的持续增长。

image.png

【AiBase提要:】

📈 ChatGPT周活跃用户数在2024年短短六个月内翻倍,达到4亿,展现出惊人的增长势头。

🛠️ 其不断迭代升级的功能和模型是用户增长的关键,特别是GPT-4o和高级语音模式的推出。

📱 ChatGPT在移动端表现稳健,移动用户占其周活跃用户的43.75%,显示出强大的用户粘性。

11、腾讯元宝功能上新:允许分享长图时是否展示AI思考过程

腾讯元宝推出新功能,用户在分享长图时可以选择是否展示AI的思考过程,提升了使用AI助手的灵活性和体验。此功能允许用户根据需求分享短图或长图,操作简单,用户可随时中断思考过程,增强了个性化和多样化的分享内容。

image.png

【AiBase提要:】

🖼️ 用户可以选择分享短图或长图,提升分享内容的个性化。

⏸️ 允许用户在分享时中断AI的思考过程,灵活调整分享内容。

💻 腾讯元宝支持多平台使用,包括Windows、macOS、iOS和Android。

12、佳士得首场 AI 艺术拍卖引发争议,成交额达72.8万美元

近日,佳士得拍卖行举办了首场以人工智能为主题的艺术拍卖会,吸引了全球的关注与争议。此次拍卖会的成交额高达728,784美元,显示出年轻群体对数字艺术的浓厚兴趣。然而,超过5,600名艺术家联合签署公开信,抗议此次拍卖,认为许多作品侵犯了版权。

【AiBase提要:】

🖌️ 超过5,600名艺术家签署公开信,要求佳士得取消 AI 艺术拍卖,认为 AI 作品侵犯了版权。

💰 佳士得拍卖会最终成交额达到728,784美元,最高成交作品为《机器幻觉》,价格为277,200美元。

🌍37% 的参与者为首次注册用户,48% 的竞标者为年轻的千禧一代和 Z 世代,显示出他们对数字艺术的兴趣。

举报

  • 相关推荐
  • 跨境支付的未来:人工智能、嵌入式金融和即时结算

    本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性;嵌入式金融将支付功能无缝融入电商平台与供应链,实现“无跳转支付”;即时结算技术将跨境支付时间从数日缩短至秒级,并优化现金流。三大技术深度融合形成协同效应,推动跨境支付向更智能、高效、无缝的方向发展,未来五年有望带动全球数字贸易规模增长1.8倍。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 数据分析迎来“智能体”时代,火山引擎披露多智能体架构性能优化关键

    在2025智能大会暨第18届中国R会议上,火山引擎专家分享了Data Agent在业务数据分析中的性能调优实践。报告指出,数据分析正从传统商业智能向数据智能体跃迁,其核心能力扩展到复杂任务的自主执行与决策。Data Agent通过工具生态、运行时管理与安全环境设计,实现全场景覆盖,具备多步骤任务规划与动态调整能力,显著降低企业数据分析门槛并提升洞察效率。未来该技术将融合多模态理解与实时计算能力,在金融、制造、医疗等领域形成规模化落地,成为企业数据价值释放的核心引擎。

  • 填补行业空白!《终端智能体可信互联技术要求》标准正式发布

    近日,IIFAA联合中国信息通信研究院发布《终端智能体可信互联技术要求》,旨在解决跨设备、跨平台智能体协同的底层信任问题。该标准基于ASL核心能力构建,聚焦可信连接、身份、意图与授权四大维度,为智能体产业提供统一安全协作框架。当前智能体互联缺乏统一标准,存在恶意攻击、隐私泄露等风险。IIFAA通过制定技术规范,填补行业空白,推动构建安全可信的智能终�

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 百度发布全球最大通用智能体 活跃用户超2000万

    在百度世界2025大会上,百度正式宣布其智能体产品GenFlow3.0已在百度文库与百度网盘全端上线,目前活跃用户突破2000万,已成为全球规模最大的通用智能体,致力于帮助用户在工作、学习和生活中成为超级个体”。 GenFlow3.0被定位为全球首个全端通用智能体,具备更强大的多模态通用能力,可实现全模态内容的输入、处理与输出。 该产品采用中心化原生Multi-Agent架构,结合行�

今日大家都在搜的词: