首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:X官方账号被冻结!Manus平替开源版来袭;腾讯混元图生视频模型开源;Mistral AI推世界OCR

2025-03-07 15:29 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、三小时复刻Manus!OpenManus横空出世,斩获GitHub3000+星标

OpenManus项目在短短三小时内复刻了Manus智能体,并迅速在GitHub上获得了超过3300个星标。该项目的安装过程简单易行,仅需修改配置文件即可使用。OpenManus集成了多个顶级大模型,展现出强大的任务处理能力,能够将复杂任务分解为清晰步骤,生成详尽报告。

【AiBase提要:】

✨ OpenManus在三小时内复刻了Manus智能体,迅速获得3300+星标。

🛠️ 安装过程简单,只需修改config.toml即可开始使用。

🤖 集成多个顶级大模型,展现出强大的任务处理能力,能够生成详尽的SEO优化报告。

详情链接:https://github.com/mannaandpoem/OpenManus

2、别抢Manus邀请码了!CAMEL-AI0天复刻Manus通用智能体OWL震撼登场

CAMEL-AI团队推出的OWL项目为开源社区带来了新的希望,凭借其在GAIA基准测试中取得的优异成绩,OWL成为开源框架的佼佼者。与Manus相比,OWL不仅完全开源,还提供了灵活高效的多智能体协作能力和强大的任务自动化功能。

image.png

【AiBase提要:】

🌟 OWL在GAIA基准测试中取得58.18的高分,成为开源框架榜首,超越Huggingface的Open Deep Research。

🔧 OWL完全开源,开发者可在GitHub上clone代码,参与框架建设,体验强大的多智能体协作能力。

📈 CAMEL-AI团队积极规划未来,包括撰写技术博客和增强工具生态,致力于复刻并超越Manus的功能。

详情链接:https://github.com/camel-ai/owl

3、阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜首

阿里巴巴推出的QwQ-32B推理模型在HuggingFace的榜单上夺得第一名,展现出卓越的性能,超越了多款知名模型如微软的Phi-4和DeepSeek-R1。该模型在数学、代码处理等方面表现出色,且由于其较小的参数量,能够在消费级显卡上实现本地部署,降低了应用成本。

image.png

【AiBase提要:】

🌟 QwQ-32B模型在HuggingFace榜单上位居第一,超越多个知名模型。

💡 该模型在性能与应用成本上实现突破,支持消费级显卡的本地部署。

📈 多项基准测试中表现优异,与最强模型DeepSeek-R1相媲美。

4、腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯近日开源了其新研发的图像转视频生成框架HunyuanVideo-I2V,旨在推动开放源代码社区的探索。该模型能够将静态图像转换为动态视频,用户只需上传图片并描述动态效果,即可生成生动的短视频。HunyuanVideo-I2V结合了多模态大语言模型,增强了对图像语义的理解。

image.png

【AiBase提要:】

🖼️ HunyuanVideo-I2V允许用户将静态图像转换为生动的视频,用户只需上传图片并描述动态效果。

🎶 模型能够自动配上背景音效,增强视频的趣味性和吸引力,同时支持对口型功能,让人物“说话”或“唱歌”。

🌐 开源内容包括模型权重和推理代码,开发者可在GitHub和HuggingFace下载,已有900多个衍生版本。

详情链接:https://video.hunyuan.tencent.com/

github:https://github.com/Tencent/HunyuanVideo-I2V

5、号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

Mistral推出的OCR API,Mistral OCR,旨在提升企业文档理解能力,能够精准提取各种文档中的信息并整理为结构化数据。它支持多语言和多模态处理,保留文档格式,提供自托管选项,并与大型语言模型集成,极大地提升了文档处理的速度和准确性。对于面临非结构化数据挑战的企业而言,Mistral OCR无疑是一项革命性的技术,助力企业实现数字化转型。

image.png

【AiBase提要:】

📝 Mistral OCR支持多种语言和文档格式,能够精准提取手写、打印文本及复杂图表,提升文档处理能力。

🔒 提供本地部署选项,满足企业对数据安全和合规性的严格要求,确保敏感信息的安全处理。

⚡ Mistral OCR在性能上表现优越,处理速度可达每分钟2000页,显著提高文档处理效率。

详情链接:https://mistral.ai/news/mistral-ocr

6、出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

出门问问与多所顶尖高校合作,推出了新一代语音生成模型TicVoice7.0,标志着语音生成技术的重大突破。该引擎采用创新的BiCodec编码技术,显著提升了语音克隆能力和情感表现力,用户可通过个性化定制获得专业级的语音体验。

image.png

【AiBase提要:】

🎤 TicVoice7.0采用BiCodec编码技术,实现语音token与文本token的高度统一,提升生成效率与可控性。

🌟 该引擎在音色相似度和情感表现力上显著提升,国际通用MOS评分从3.9提升至4.2,提供更自然的听感体验。

📈 用户可通过调整性别、语速等属性进行个性化定制,获得播音级专业配音体验,MOS评分达到4.7,适用于影视、游戏等场景。

7、Windsurf Wave4版本发布,新增预览功能、支持指哪改哪

Codeium最新发布的Windsurf Wave4为程序员带来了全新的编码体验,特别是新增的预览功能使得修改代码时能够即时看到效果,极大提升了编码效率。Tab to Import功能让添加依赖变得更加轻松,Cascade小助手则为下一步操作提供智能建议。

image.png

【AiBase提要:】

🔍 预览功能让你在修改代码时即时查看效果,提升编码效率。

⌨️ Tab to Import功能简化了依赖包的添加过程,极大提高了工作流。

🛠️ Linter集成实时检查代码质量,确保生成代码的准确性。

详情链接:https://codeium.com/blog/windsurf-wave-4

8、Anthropic Console新平台上线,支持团队协作编辑管理promp功能

Anthropic最近对其开发者平台进行了重要升级,推出了全新的团队协作功能和Claude3.7Sonnet模型的扩展推理能力,旨在解决企业在人工智能实施中的痛点。新功能包括可分享的prompts、思考可视化和自动生成高质量prompts的工具,极大提升了团队协作效率和模型性能,确保开发者能够更轻松地管理和优化他们的AI模型。

【AiBase提要:】

🤝 升级后的Anthropic Console支持团队协作,提供可分享的prompts功能,提升协作效率。

🧠 Claude3.7Sonnet模型支持扩展思考过程的可视化,增强了模型的响应能力和思考预算控制。

⚙️ Console提供自动优化和模型响应评估功能,帮助用户生成高质量的prompts并进行有效测试。

详情链接:https://www.anthropic.com/news/upgraded-anthropic-console

9、Manus回应官方X账号被冻结:与加密货币诈骗无关

Manus联合创始人季逸超对公司官方X账号被冻结事件进行了回应,强调该事件与加密货币诈骗无关,并表示Manus从未参与任何加密货币项目。公司正在采取法律行动以保护品牌形象,并鼓励用户举报可疑账户。同时,Manus预计将在未来几天内恢复账号运营,并继续通过其他社交媒体与用户沟通。

image.png

【AiBase提要:】

🔒 官方X账号因可能与加密货币诈骗有关而被冻结,Manus正在与X团队合作解决问题。

🚫 Manus声明未参与任何加密货币项目,冒名顶替者均属欺诈行为,已采取法律行动。

📈 Manus是全球首款通用Agent产品,能独立执行复杂任务,应用于多种场景。

10、稳居第一!ChatGPT周活跃用户数达4亿,仅用六个月实现翻倍

根据Andreessen Horowitz发布的报告,OpenAI的ChatGPT在2024年下半年展现了惊人的用户增长,周活跃用户数在短短六个月内翻倍,达到4亿。自2022年推出以来,ChatGPT的用户增长速度令人瞩目,尤其是其不断迭代的功能和模型,如GPT-4o和高级语音模式,极大推动了用户的持续增长。

image.png

【AiBase提要:】

📈 ChatGPT周活跃用户数在2024年短短六个月内翻倍,达到4亿,展现出惊人的增长势头。

🛠️ 其不断迭代升级的功能和模型是用户增长的关键,特别是GPT-4o和高级语音模式的推出。

📱 ChatGPT在移动端表现稳健,移动用户占其周活跃用户的43.75%,显示出强大的用户粘性。

11、腾讯元宝功能上新:允许分享长图时是否展示AI思考过程

腾讯元宝推出新功能,用户在分享长图时可以选择是否展示AI的思考过程,提升了使用AI助手的灵活性和体验。此功能允许用户根据需求分享短图或长图,操作简单,用户可随时中断思考过程,增强了个性化和多样化的分享内容。

image.png

【AiBase提要:】

🖼️ 用户可以选择分享短图或长图,提升分享内容的个性化。

⏸️ 允许用户在分享时中断AI的思考过程,灵活调整分享内容。

💻 腾讯元宝支持多平台使用,包括Windows、macOS、iOS和Android。

12、佳士得首场 AI 艺术拍卖引发争议,成交额达72.8万美元

近日,佳士得拍卖行举办了首场以人工智能为主题的艺术拍卖会,吸引了全球的关注与争议。此次拍卖会的成交额高达728,784美元,显示出年轻群体对数字艺术的浓厚兴趣。然而,超过5,600名艺术家联合签署公开信,抗议此次拍卖,认为许多作品侵犯了版权。

【AiBase提要:】

🖌️ 超过5,600名艺术家签署公开信,要求佳士得取消 AI 艺术拍卖,认为 AI 作品侵犯了版权。

💰 佳士得拍卖会最终成交额达到728,784美元,最高成交作品为《机器幻觉》,价格为277,200美元。

🌍37% 的参与者为首次注册用户,48% 的竞标者为年轻的千禧一代和 Z 世代,显示出他们对数字艺术的兴趣。

举报

  • 相关推荐
  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。