首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:王炸!Anthropic开源模型上下文协议MCP;阿里​通义App上线局部风格化功能; Kimi 数学版上线

2024-11-26 15:25 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、万物皆可一键毛茸茸!阿里通义App上线“局部风格化”功能

通义App最近推出的“局部风格化”功能引发了社交平台的热潮。用户只需简单操作,就能为照片添加多种风格化效果。通义万相ACE图片编辑模型的支持,使得用户可以通过简单描述实现图像编辑,极大地降低了使用门槛。

image.png

【AiBase提要:】

🖼️ 用户可以通过通义App的“局部风格化”功能,轻松为照片中的特定对象添加风格化效果。

✨ 首批上线的风格模板包括针织、毛绒、冰雕和陶瓷等七种,丰富了用户的选择。

🤖 该功能基于通义万相ACE模型,用户只需口语化描述意图,即可完成各种图像编辑任务。

2、阿里国际AI团队开源开放型问题推理模型Marco-o1

阿里巴巴国际AI团队推出的Marco-o1模型,专注于解决开放型问题,超越了传统的标准答案领域。该模型通过创新的self-play和MCTS技术,构建了具备反思能力的超长CoT数据,展现了在机器翻译和其他领域的强大能力。

image.png

【AiBase提要:】

🧠 Marco-o1模型专注于开放型问题的解决,超越了传统的学科领域。

🔍 该模型通过self-play和MCTS技术,构建了具备反思和改正能力的超长CoT数据。

🌐 研究团队计划开源更多数据与模型,推动AI领域的进一步发展。

详情链接:https://modelscope.cn/models/AIDC-AI/Marco-o1

3、Anthropic发布开源MCP协议 推动AI系统与数据源的双向连接

Anthropic推出的模型上下文协议(MCP)旨在通过连接AI助手与多种数据源,提高查询响应的质量和相关性。MCP解决了AI助手与数据源之间的隔离问题,允许开发者在应用程序与数据源之间建立双向连接,简化了系统的扩展性。

【AiBase提要:】

🌐 MCP协议允许AI助手直接从多个数据源提取信息,解决信息孤岛问题。

🔄 开发者可以通过MCP服务器共享数据,简化与不同数据源的连接。

📈 目前已有多家公司集成MCP,Anthropic还提供了预构建的MCP服务器以支持企业应用。

详情链接:https://www.anthropic.com/news/model-context-protocol

4、Runway推图像生成模型Frames 专注特定美学,重构创意边界

Runway的Frames模型以革命性的方式重新定义了视觉创作的可能性。Frames的独特之处在于其对风格和美学的精细控制,使每一帧都能展现出艺术家的风格,同时激发创意的多样性。

【AiBase提要:】

✨ Frames模型提供细粒度的控制,用户可精确调整图像的外观和氛围。

🌈 该工具在保持风格一致的同时,激发创意的多样性,适合各种视觉项目。

🚀 Frames不仅是技术升级,更是创意民主化的突破,适合所有创作者。

详情链接:https://runwayml.com/research/introducing-frames

5、脑洞大开!Luma推全新Dream Machine 文字、图像、视频一条龙服务

Luma AI推出了Dream Machine平台,旨在简化高质量图像和视频的创作过程,适合各种技术水平的用户。该平台基于先进的Photon图像基础模型,允许用户通过自然语言或参考图像进行创作,省去复杂的提示工程。Dream Machine的直观设计和强大的功能,如角色参考、镜头运动等。

【AiBase提要:】

🖼️ Dream Machine平台基于Luma最新的Photon模型,支持高质量图像生成。

💬 用户可以通过自然语言描述或上传参考图像,简化创作过程。

🎥 平台提供动画故事情节制作功能,确保视频中的角色一致性。

详情链接:https://lumalabs.ai/dream-machine

6、英伟达出品!AI音频模型Fugatto:输入文本、音频可生成音乐、音效

Fugatto是NVIDIA推出的一款革命性音频生成模型,具备25亿参数,旨在通过文本和音频输入为音乐创作提供灵活支持。该模型突破了传统音频生成的局限,采用创新的数据生成方法和可组合音频表示变换技术,使艺术家和开发者能够实时生成和修改声音。

【AiBase提要:】

🎵 Fugatto是NVIDIA推出的音频AI模型,拥有25亿参数,支持文本与音频输入。

💻 采用创新的数据生成方法和可组合音频表示变换技术,使得用户能够灵活生成和修改声音。

🌟 初步测试显示,Fugatto在音频合成与变换方面的表现优于多种专业模型。

详情链接:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

7、新型AI图像生成框架OminiControl:可将素材主体融入生成图片中

OminiControl是新加坡国立大学研究团队提出的图像生成框架,旨在提升图像生成的灵活性和效率。通过参数重用机制,该框架能够以更少的额外参数处理图像条件,显著提高生成能力。它还提供了一个名为Subjects200K的数据集,包含超过20万张一致性图像,为研究人员提供了丰富的资源。

image.png

【AiBase提要:】

🌟 OminiControl通过参数重用机制,让图像生成的控制能力更强大,效率更高。

🎨 该框架能同时处理多种图像条件任务,如边缘、深度图等,适应不同创作需求。

📸 团队发布了超过20万张图像的数据集Subjects200K,助力进一步的研究与探索。

详情链接:https://huggingface.co/spaces/Yuanshi/OminiControl

8、三星有意将ChatGPT集成到Galaxy AI,挑战谷歌Gemini

金融分析师Dan Nystedt透露,OpenAI正与三星电子洽谈合作,计划将ChatGPT集成到三星最新的Galaxy AI系统中。这一合作有望提升三星AI系统的语言理解和交互能力,可能对谷歌的Gemini构成挑战。

【AiBase提要:】

📱 三星与OpenAI洽谈将ChatGPT集成到Galaxy AI,提升语言理解能力。

🌐 此次合作可能对谷歌的Gemini模型造成重大冲击,打破其市场主导地位。

🤝 这并非首次合作传闻,三星与OpenAI的互动潜力持续加深。

9、苹果公布2024年度iPhone应用”入围名单, AI应用再度被冷落

苹果公司近日公布了2024年“年度iPhone应用”入围名单,显示出对人工智能技术在移动应用生态系统中影响的低估。尽管ChatGPT等AI应用在市场上表现出色,但在提名中却未能获得认可。

【AiBase提要:】

📉 苹果2024年“年度iPhone应用”提名名单再次忽视了AI应用的影响。

🎨 提名的应用主要聚焦于激发人类创造力,而非依赖AI自动化功能。

🏆 少数AI应用在iPad和Mac的年度提名中出现,但整体提名数量较少。

10.Kimi 数学版上线,科学思维解读生活

Kimi 数学版正式上线,用户可通过网页与 k0-math 模型互动,深入理解数学知识。此版本支持 LaTeX 输入及公式转换,提升用户体验。未来将推出移动版,团队致力于优化功能和互动性,增强用户在学习数学时的乐趣。

【AiBase 提要:】

🌟 Kimi 数学版通过 k0-math 模型提供数学互动体验。

🎮 用户可通过此版解答问题,享受科学维解读生活。

📚 支持 LaTeX 输入和公式截图转换,方便用户操作。

11、英特尔研究显示使用AI PC每周能省 4 小时工作时间

英特尔公司最新发布的研究报告揭示,AI电脑能够显著提高用户的工作效率,平均每周为用户节省超过 240 分钟的工作时间。这项研究强调了AI电脑在任务处理、隐私保护和自适应学习方面的优势。

【AiBase提要:】

⏳ AI PC 每周可为用户节省 240 分钟的日常工作时间。

💰 科技公司预计到 2025 年将在 AI 基础设施上投入超过 2000 亿美元。

⚠️ AI 初创企业面临融资挑战,可能会减缓创新速度。

举报

  • 相关推荐
  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 双11鸿蒙应用持续升级,小艺、应用市场等App让购物更省心

    双十一期间,华为应用市场推出"11.11好物集"专题,提供购物指南与达人穿搭参考,帮助用户高效筛选商品。鸿蒙系统的小艺助手支持商品比价、智能下单及多任务语音操作,简化购物流程。出境游用户可使用天际通流量服务,无需实体卡,按天计费;配合云空间自动释放本地存储,保障旅行照片视频安全同步。通过智慧功能与便捷服务,为用户打造更流畅、安全的消费与出行体验。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 卡地亚与猎豹:风格视野 ——卡地亚连续六年参展中国国际进口博览会

    2025年11月5日,法国殿堂级品牌卡地亚以“卡地亚与猎豹:风格视野”为主题参展第八届中国国际进口博览会。作为历峰集团“隽永风格,雅述至美”展馆主要成员,卡地亚通过标志性猎豹形象,展现创意与精湛工艺的传承,传递品牌隽永美学。展区汇集珠宝与腕表新作,以“野性自然”“寰宇探索”“精湛工艺”三大主题,凸显猎豹作为品牌创意根基的重要性。通过独家“皮�

今日大家都在搜的词: