首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:王炸!Anthropic开源模型上下文协议MCP;阿里​通义App上线局部风格化功能; Kimi 数学版上线

2024-11-26 15:25 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、万物皆可一键毛茸茸!阿里通义App上线“局部风格化”功能

通义App最近推出的“局部风格化”功能引发了社交平台的热潮。用户只需简单操作,就能为照片添加多种风格化效果。通义万相ACE图片编辑模型的支持,使得用户可以通过简单描述实现图像编辑,极大地降低了使用门槛。

image.png

【AiBase提要:】

🖼️ 用户可以通过通义App的“局部风格化”功能,轻松为照片中的特定对象添加风格化效果。

✨ 首批上线的风格模板包括针织、毛绒、冰雕和陶瓷等七种,丰富了用户的选择。

🤖 该功能基于通义万相ACE模型,用户只需口语化描述意图,即可完成各种图像编辑任务。

2、阿里国际AI团队开源开放型问题推理模型Marco-o1

阿里巴巴国际AI团队推出的Marco-o1模型,专注于解决开放型问题,超越了传统的标准答案领域。该模型通过创新的self-play和MCTS技术,构建了具备反思能力的超长CoT数据,展现了在机器翻译和其他领域的强大能力。

image.png

【AiBase提要:】

🧠 Marco-o1模型专注于开放型问题的解决,超越了传统的学科领域。

🔍 该模型通过self-play和MCTS技术,构建了具备反思和改正能力的超长CoT数据。

🌐 研究团队计划开源更多数据与模型,推动AI领域的进一步发展。

详情链接:https://modelscope.cn/models/AIDC-AI/Marco-o1

3、Anthropic发布开源MCP协议 推动AI系统与数据源的双向连接

Anthropic推出的模型上下文协议(MCP)旨在通过连接AI助手与多种数据源,提高查询响应的质量和相关性。MCP解决了AI助手与数据源之间的隔离问题,允许开发者在应用程序与数据源之间建立双向连接,简化了系统的扩展性。

【AiBase提要:】

🌐 MCP协议允许AI助手直接从多个数据源提取信息,解决信息孤岛问题。

🔄 开发者可以通过MCP服务器共享数据,简化与不同数据源的连接。

📈 目前已有多家公司集成MCP,Anthropic还提供了预构建的MCP服务器以支持企业应用。

详情链接:https://www.anthropic.com/news/model-context-protocol

4、Runway推图像生成模型Frames 专注特定美学,重构创意边界

Runway的Frames模型以革命性的方式重新定义了视觉创作的可能性。Frames的独特之处在于其对风格和美学的精细控制,使每一帧都能展现出艺术家的风格,同时激发创意的多样性。

【AiBase提要:】

✨ Frames模型提供细粒度的控制,用户可精确调整图像的外观和氛围。

🌈 该工具在保持风格一致的同时,激发创意的多样性,适合各种视觉项目。

🚀 Frames不仅是技术升级,更是创意民主化的突破,适合所有创作者。

详情链接:https://runwayml.com/research/introducing-frames

5、脑洞大开!Luma推全新Dream Machine 文字、图像、视频一条龙服务

Luma AI推出了Dream Machine平台,旨在简化高质量图像和视频的创作过程,适合各种技术水平的用户。该平台基于先进的Photon图像基础模型,允许用户通过自然语言或参考图像进行创作,省去复杂的提示工程。Dream Machine的直观设计和强大的功能,如角色参考、镜头运动等。

【AiBase提要:】

🖼️ Dream Machine平台基于Luma最新的Photon模型,支持高质量图像生成。

💬 用户可以通过自然语言描述或上传参考图像,简化创作过程。

🎥 平台提供动画故事情节制作功能,确保视频中的角色一致性。

详情链接:https://lumalabs.ai/dream-machine

6、英伟达出品!AI音频模型Fugatto:输入文本、音频可生成音乐、音效

Fugatto是NVIDIA推出的一款革命性音频生成模型,具备25亿参数,旨在通过文本和音频输入为音乐创作提供灵活支持。该模型突破了传统音频生成的局限,采用创新的数据生成方法和可组合音频表示变换技术,使艺术家和开发者能够实时生成和修改声音。

【AiBase提要:】

🎵 Fugatto是NVIDIA推出的音频AI模型,拥有25亿参数,支持文本与音频输入。

💻 采用创新的数据生成方法和可组合音频表示变换技术,使得用户能够灵活生成和修改声音。

🌟 初步测试显示,Fugatto在音频合成与变换方面的表现优于多种专业模型。

详情链接:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

7、新型AI图像生成框架OminiControl:可将素材主体融入生成图片中

OminiControl是新加坡国立大学研究团队提出的图像生成框架,旨在提升图像生成的灵活性和效率。通过参数重用机制,该框架能够以更少的额外参数处理图像条件,显著提高生成能力。它还提供了一个名为Subjects200K的数据集,包含超过20万张一致性图像,为研究人员提供了丰富的资源。

image.png

【AiBase提要:】

🌟 OminiControl通过参数重用机制,让图像生成的控制能力更强大,效率更高。

🎨 该框架能同时处理多种图像条件任务,如边缘、深度图等,适应不同创作需求。

📸 团队发布了超过20万张图像的数据集Subjects200K,助力进一步的研究与探索。

详情链接:https://huggingface.co/spaces/Yuanshi/OminiControl

8、三星有意将ChatGPT集成到Galaxy AI,挑战谷歌Gemini

金融分析师Dan Nystedt透露,OpenAI正与三星电子洽谈合作,计划将ChatGPT集成到三星最新的Galaxy AI系统中。这一合作有望提升三星AI系统的语言理解和交互能力,可能对谷歌的Gemini构成挑战。

【AiBase提要:】

📱 三星与OpenAI洽谈将ChatGPT集成到Galaxy AI,提升语言理解能力。

🌐 此次合作可能对谷歌的Gemini模型造成重大冲击,打破其市场主导地位。

🤝 这并非首次合作传闻,三星与OpenAI的互动潜力持续加深。

9、苹果公布2024年度iPhone应用”入围名单, AI应用再度被冷落

苹果公司近日公布了2024年“年度iPhone应用”入围名单,显示出对人工智能技术在移动应用生态系统中影响的低估。尽管ChatGPT等AI应用在市场上表现出色,但在提名中却未能获得认可。

【AiBase提要:】

📉 苹果2024年“年度iPhone应用”提名名单再次忽视了AI应用的影响。

🎨 提名的应用主要聚焦于激发人类创造力,而非依赖AI自动化功能。

🏆 少数AI应用在iPad和Mac的年度提名中出现,但整体提名数量较少。

10.Kimi 数学版上线,科学思维解读生活

Kimi 数学版正式上线,用户可通过网页与 k0-math 模型互动,深入理解数学知识。此版本支持 LaTeX 输入及公式转换,提升用户体验。未来将推出移动版,团队致力于优化功能和互动性,增强用户在学习数学时的乐趣。

【AiBase 提要:】

🌟 Kimi 数学版通过 k0-math 模型提供数学互动体验。

🎮 用户可通过此版解答问题,享受科学维解读生活。

📚 支持 LaTeX 输入和公式截图转换,方便用户操作。

11、英特尔研究显示使用AI PC每周能省 4 小时工作时间

英特尔公司最新发布的研究报告揭示,AI电脑能够显著提高用户的工作效率,平均每周为用户节省超过 240 分钟的工作时间。这项研究强调了AI电脑在任务处理、隐私保护和自适应学习方面的优势。

【AiBase提要:】

⏳ AI PC 每周可为用户节省 240 分钟的日常工作时间。

💰 科技公司预计到 2025 年将在 AI 基础设施上投入超过 2000 亿美元。

⚠️ AI 初创企业面临融资挑战,可能会减缓创新速度。

举报

  • 相关推荐
  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 祝贺!诺云荣登“人工智能+”新质生产力领航企业百强!

    2025年9月8日,国务院发布人工智能发展指导意见后,诺云凭借AI营销创新实践入选“人工智能+新质生产力百强榜单”,成为河南唯一入选企业。作为数字化营销技术服务商,诺云提供企业直播SaaS系统与私域运营工具,覆盖电商直播、企业培训等全场景需求。已服务超20万家企业,覆盖3亿用户,拓展至零售、教育等150多个行业,客户包括携程、华为等头部机构。诺云将持续深化AI技术应用,激发新质生产力潜能。

  • 王忠林赴格创东智调研人工智能产业高质量发展情况

    9月11日,湖北省领导王忠林一行调研格创东智人工智能产业发展。公司CEO何军汇报了自主研发的工业智能平台、能碳管理系统等应用成果。王忠林强调要深化人工智能在工业研发、生产等领域的应用,促进全要素智能联动,更好服务制造业向智能制造转型升级。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 深入实施“人工智能+”,伊顿助力皓扬数据打造 AI 算力中心标杆

    近日,备受瞩目的《关于深入实施“人工智能+”行动的意见》正式发布,提出六大行动覆盖科技、产业、全球合作等领域。到2030年,新一代智能终端、智能体等应用普及率超90%,为数字基础设施建设勾勒出了宏大版图。北京皓扬云数据科技有限公司(以下简称:皓扬数据)作为国内 AI 算力中心开拓先锋,以覆盖全国的超大规模交付能力服务于数百家头部企业。两位创始人已在�

  • 普适性覆盖人工智能典型场景 寒武纪产品技术优势凸显

    中科寒武纪科技预计2025年全年实现营业收入50亿至70亿元。公司已全面掌握智能芯片及基础系统软件研发核心技术,截至2025年6月30日,累计获授权专利1599项。2025年上半年,公司实现营业收入28.81亿元,同比增长4347.82%,净利润扭亏为盈。寒武纪持续优化智能处理器微架构及指令集,新一代产品将提升编程灵活性、易用性、性能及能效。高盛维持对公司的积极看法,上调12个月目标价至2104元,并调高2030年预期EBITDA及企业价值倍数。

今日大家都在搜的词: