首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:科大讯飞星火多模态交互大模型上线;Anthropic发布提示词优化新功能;腾讯AI智能工作台ima上线Windows版

2024-11-15 15:26 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、科大讯飞星火多模态交互大模型上线 实现“语音、视觉、数字人交互”三合一

科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。该模型集成了语音、视觉和数字人交互功能,实现了三者的无缝结合,引入了超拟人数字人技术,提升了AI的生动性和真实感。新模型通过跨模态的语义一致性实现了情感表达更加真实连贯,支持超拟人极速交互技术,提供个性化的交互体验。多模态视觉交互使模型能全面感知背景场景、物流状态,为用户提供更丰富和精准的交互体验。

image.png

【AiBase提要:】

🌟 科大讯飞推出讯飞星火多模态交互大模型,集成语音、视觉和数字人交互功能,实现无缝结合。

🔥 引入超拟人数字人技术,数字人动作与语音内容精准匹配,提升AI的生动性和真实感。

💡 支持超拟人极速交互技术,实现语音到语音的端到端建模,提供个性化的交互体验。

详情链接:https://www.xfyun.cn/solutions/Multimodel

2、Anthropic发布提示词优化新功能

Anthropic最新推出的提示词优化新功能为开发者带来了巨大便利,提升AI应用的可靠性和效率。优化器通过先进工程技术自动完善提示词,准确率提升30%,字数准确率达100%,用户可提供反馈进一步改进。示例管理功能使开发者能结构化管理示例,简化流程。Kapa.ai已成功迁移多个AI工作流至Claude平台,称赞优化器帮助提速生产环节。

image.png

【AiBase提要:】

🔍 提示词优化新功能提升AI应用可靠性和效率

🚀 优化器自动完善提示词,准确率提升30%,字数准确率达100%

💡 示例管理功能简化示例管理流程,Kapa.ai成功迁移多个AI工作流至Claude平台

详情链接:https://www.anthropic.com/news/prompt-improver

3、大升级!ChatGPT Windows桌面版全面上线,macOS版新增与应用协作功能

OpenAI发布了重要更新,提升ChatGPT在Windows和Mac系统上的实用性。Windows桌面应用正式上线,macOS测试版本与热门编码应用深度集成,变身为实时助手。对开发者带来重大利好。

image.png

【AiBase提要:】

🚀 ChatGPT Windows桌面应用全面上线,提升用户体验。

💻 macOS新增与应用协作功能,开发者可直接分析代码获取智能建议。

📈 OpenAI计划扩展更多应用支持,助力AI工具在桌面工作中实用性提升。

详情链接:https://openai.com/chatgpt/desktop/?ref=maginative.com

4、腾讯AI智能工作台ima.copilot上线Windows版本

腾讯公司推出的ima.copilot(简称ima)Windows版,不仅具备搜索功能,还能回答问题、创作文本、生成图片,展现了腾讯在人工智能领域的技术实力和深入探索。ima特别引人注目的搜索功能整合了微信公众号文章资源,丰富了搜索结果,提高了信息获取效率和质量。ima支持处理本地文件、多语言翻译,提供个人知识库和24小时在线私人助理服务,为用户提供便捷高效的工作学习体验。

image.png

【AiBase提要:】

🔍 搜索功能整合微信公众号文章资源,丰富搜索结果,提高信息获取效率和质量。

📄 处理本地文件,自动总结内容,生成脑图,支持多语言翻译,方便用户理解和使用不同语言资料。

📚 提供个人知识库和24小时在线私人助理服务,为用户打造专属图书馆,提供便捷高效的工作学习体验。

详情链接:https://ima.qq.com/

5、一句话帮你生成应用!阿里通义上线代码模式

阿里通义实验室推出了代码模式,让用户能够通过简单的日常语言指令生成各种应用,包括小游戏、数据图表、网站和简历等。用户只需访问通义网页版,点击“代码模式”即可开始体验全新交互方式。代码模式特别为非编程用户提供便利,支持预设热门应用模板,如个人简历、2048小游戏等。基于Qwen2.5-Coder开发,提升了AI编程性能和效率。

image.png

【AiBase提要:】

👩‍💻 通义代码模式让用户通过简单指令生成各种应用,包括小游戏、数据图表等。

🌐 用户可访问通义网页版,点击“代码模式”开始体验全新交互方式。

🚀 代码模式基于Qwen2.5-Coder开发,提升了AI编程性能和效率。

6、波士顿动力Spot 机器人新技能 轻松躲避电线、梯子等障碍物!

波士顿动力公司的机器人犬 Spot 近期进行了重要的软件更新,使其在复杂环境中的行动能力大幅提升。这次更新不仅增强了 Spot 的自主导航能力,也为其在更多复杂环境中的应用奠定了基础。

image.png

【AiBase提要:】

🐶 Spot 机器人现在可以自动识别和避开电线、梯子等障碍物。

🤖 最新 的视频中出现了神秘的恐龙头机器人,激发了观众的好奇心。

📈 软件更新使 Spot 的导航能力更强,应用前景更加广阔。

7、谷歌Gemini Exp1114横空出世!首战碾压GPT-4,多项能力评测登顶引业界震动

谷歌最新推出的Gemini实验版本(Exp1114)在Chatbot Arena平台上取得了令人瞩目的成绩,超越竞品,展现出惊人实力。Gemini-Exp-1114以超出40分的优异成绩与GPT-4-latest并列第一,在数学、复杂提示和创意写作等核心领域全面登顶。业内分析认为,这次突破性进展显示出谷歌在AI领域的长期投入开始收获成果。

image.png

【AiBase提要:】

🚀 Gemini-Exp-1114在总体评分上超越GPT-4-latest并列第一,展现出极强的综合实力。

💡 Gemini-Exp-1114在数学、复杂提示和创意写作等核心领域全面登顶,表现令人印象深刻。

🔗 Gemini-Exp-1114的突破性进展显示出谷歌在AI领域的长期投入开始收获成果,引发业界讨论和关注。

8、TikTok重磅推出AI视频创作工具Symphony,赋能商业广告创作全流程

TikTok宣布全面开放Symphony Creative Studio,为广告主和内容创作者带来前所未有的创作体验,让视频制作更简单高效,无需额外费用。这标志着社交媒体平台在AI创意工具领域的竞争加剧,展现了TikTok在AI视频创作领域的技术实力和商业化进程中的决心。

【AiBase提要:】

🚀 Symphony Creative Studio集视频生成、转换和扩展功能于一体,帮助广告主和创作者突破创意到制作瓶颈,提供快速生成视频内容的功能。

👥 支持AI虚拟人物视频创作,用户可选择现成或定制虚拟形象,系统自动生成视频,广告主可进一步优化。

🎨 提供视频翻译配音、现有视频编辑等功能,根据广告主历史活动自动生成视频内容,为品牌广告主带来更高效、创意的内容制作体验。

9、AI玩《我的世界》大比拼!Claude新版本建筑水平惊艳全网

最近在《我的世界》平台上展开了一场别开生面的AI能力评测,引起了广泛关注。新旧版本的Claude3.5Sonnet在游戏中展开建筑PK,展现出明显的能力差异,新版本Sonnet3.6表现尤为亮眼。评测被戏称为唯一可靠的评测基准,得到开源社区支持并在GitHub上线。AI在游戏中建造过程不依赖视觉理解,通过文本形式提供上下文生成操作指令。

image.png

【AiBase提要:】

🌟 Sonnet3.6在创意性方面胜出,获得2000多名网友的投票支持。

🧠 AI建造过程不依赖视觉理解,通过文本形式提供上下文生成操作指令。

🔧 项目组计划将评测机制进一步完善,打造类似Lmsys竞技场的评分系统,采用Elo算法根据人类用户投票进行排名。

详情链接:https://x.com/mckaywrigley/status/1849613686098506064

10、小马智行正式启动 IPO,预计募资最高达3.78亿美元

小马智行正式启动 IPO,计划在纳斯达克上市,募资最高达3.78亿美元。多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。【AiBase提要:】

🌟 小马智行开启IPO,计划在纳斯达克上市,募资最高达3.78亿美元。

🚗 主要资金将用于自动驾驶服务的商业化及技术研发。

🤝 多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。

举报

  • 相关推荐
  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 人工智能落地“最后一公里”,戴尔工作站助力AI应用提速

    AI应用落地面临“最后一公里”部署难题:传统流程繁琐耗时,从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态,通过本地工作站进行小规模测试验证,降低试错成本与数据泄露风险,再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率,释放团队创造力,让有价值的AI想法快速照进现实。

  • 科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案

    在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布星火大模型最新升级及系列产品。董事长刘庆峰指出,AI红利兑现需攻克自主可控、软硬一体、行业纵深和个性化四大核心,并展示了在300多个“开箱即用”智能体中涌现的优秀“AI员工”。星火X1.5采用MoE架构,推理效率提升100%,多语言能力覆盖超130语种,整体性能达GPT-5的95%以上。同时发布软硬一体解决方案,包括AI麦克风阵列、翻译机等,实现高精度降噪与识别。此外,推出个性化记忆与语音复刻技术,定义多模态交互八大能力,并展示AI在教育、医疗、汽车、办公及情感陪伴等领域的深度应用,启动“星火点亮全球”计划,共建繁荣AI生态。

  • 跨境支付的未来:人工智能、嵌入式金融和即时结算

    本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性;嵌入式金融将支付功能无缝融入电商平台与供应链,实现“无跳转支付”;即时结算技术将跨境支付时间从数日缩短至秒级,并优化现金流。三大技术深度融合形成协同效应,推动跨境支付向更智能、高效、无缝�

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 科大讯飞“AI+文旅”产品全新升级

    在2025科大讯飞全球1024开发者节期间,"AI+文旅"产品升级发布,展示AI如何让文旅体验从"到此一游"升级为"深度体验"。重点包括:数字人技术让李白"讲解"庐山瀑布,虚拟人交互平台支持一键定制景区专属形象;讯飞翻译机2.0支持80种外语实时对话;AI伴游APP可生成个性化行程。同时,AI开发者大赛优秀团队展示了三维重建、互动短剧、MR博物馆等创新实践,体现AI在智慧文旅全流程的应用潜力。

  • 科大讯飞1024发布:讯飞翻译APP迭代焕新,同声传译+音视频翻译重构沟通体验

    在2025科大讯飞全球1024开发者节期间,讯飞翻译APP迎来关键升级,重点强化同声传译功能。通过搭载全新语音同传大模型,实现翻译更准、响应更快;新增实时分享、记录留存、悬浮字幕等特性,支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性,结合IDC报告八大维度第一的权威背书,彰显了AI翻译技术从研发到落地的全链条优势,为跨语言沟通提供简单如母语的体验。

  • 「1024 | 科大讯飞全球红人中国行」:共见中国品牌全球营销新征程

    科大讯飞在2024全球1024开发者节期间举办"全球红人中国行"活动,邀请六位总粉丝超1200万的海外红人来华,通过AI技术赋能红人营销,探索中国品牌全球化新路径。活动结合产品体验与跨文化对话,借助iFLYTalent平台实现红人营销全链路智能化,助力品牌精准触达欧美、东南亚等市场,推动从"产品出海"到"品牌出海"的升级,以"AI+红人"生态突破文化壁垒,重塑全球营销新范式。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

今日大家都在搜的词: