首页 > 原创 > 关键词  > OpenAI最新资讯  > 正文

AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

2025-06-05 15:46 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI宣布ChatGPT推出MCP支持与会议记录功能

我作为一位AI助手,对OpenAI推出的这两项功能感到非常兴奋。MCP支持让ChatGPT能无缝连接企业内部数据,而会议记录模式则大大提高了团队协作效率。这不仅提升了ChatGPT的实用性,也为企业的数字化转型提供了强大助力。

image.png

【AiBase提要:】

✅ 支持Model Context Protocol (MCP),实现私域知识的智能检索与分析。

🎙️ 新增会议记录模式,自动转录会议内容并生成关键要点和行动计划。

🔒 与微软Azure合作,增强企业场景中的安全性和可扩展性。

2、Cursor1.0正式发布:全新Bugbot功能,审查代码修复bug

Cursor1.0推出,带来BugBot、Background Agent、Jupyter 支持及 Memories 功能,显著提升开发效率。深度整合 AI 技术,优化代码审查、远程开发和项目管理。

image.png

【AiBase提要:】

🤖 BugBot 自动化代码审查与修复,减少手动审查时间,提升团队协作效率。

💻 Background Agent 提供流畅远程编码体验,优化多设备开发一致性。

📊 新增 Jupyter 支持与 Memories 功能,助力数据科学与项目管理。

详情链接:https://www.cursor.com/changelog

3、Midjourney视频重磅来袭!V8模型蓄势待发,AI创意新时代即将来临!

Midjourney即将上线视频功能,同时V7.1和V8模型的开发也在加速推进。文章详细解析了Midjourney的最新动态,包括视频功能的突破、服务器升级、风格引用优化及未来模型规划。

image.png

【AiBase提要:】

🌟视频功能即将上线,初期仅支持图像到视频转换,价格亲民,年度订阅用户优先体验。

⚙️服务器扩容加速,支持视频生成与模型优化,确保流畅用户体验。

🎨风格引用功能升级,提升准确性并新增随机风格生成,提供更多创意选择。

4、秘塔AI搜索“今天学点啥”视频讲解页面上线PPT导出功能

秘塔AI搜索旗下的“今天学点啥”平台响应用户需求,新增PPT导出功能,支持下载完整讲解PPT,包括图文、语音和逐字稿,但该功能需消耗计算资源,目前提供限时免费体验。

微信截图_20250605102004.png

【AiBase提要:】

🎉 用户可在视频讲解页面点击‘导出PPT’按钮下载包含图文、语音和逐字稿的完整PPT。

📚 平台因算力限制,导出功能将在前三天免费,后续需消耗计算额度,注册用户有初始赠送额度。

💬 功能上线源于用户反馈,体现了平台对用户需求的重视与快速响应能力。

5、文生视频功能上线,Manus挑战OpenAI的Sora

AI初创公司Manus推出了‘文生视频’功能,用户可通过文本指令生成视频,与OpenAI的Sora展开竞争。

image.png

【AiBase提要:】

🚀 Manus发布‘文生视频’功能,支持Basic、Plus和Pro会员抢先体验。

🤝 与OpenAI的Sora类似,Manus提供灵活会员制,最高Pro会员费用约1431元人民币。

🌟 推动AI视频创作普及,为内容创作者提供高效工具,加速行业创新与发展。

6、法国AI巨头Mistral推出企业编码助手,正面挑战GitHub Co pilot霸主地位

Mistral AI发布企业编码助手Mistral Code,通过本地部署和深度定制能力挑战GitHub Co pilot市场地位。产品结合最新AI模型与IDE插件,提供垂直集成解决方案,解决企业采用AI编码助手的关键障碍。

【AiBase提要:】

✨ 提供本地部署和深度定制能力,确保代码安全不离开公司服务器。

🔍 通过垂直集成产品解决企业采用AI编码助手的四大障碍,提供全面支持。

🌟 强大的开源Devstral模型,性能优越且适合企业级数据隐私需求。

7、英伟达发布Llama Nemotron Nano VL AI:登顶 OCRBench,高精度文档处理解决方案

英伟达推出Llama Nemotron Nano VL,一款基于Llama3.1架构的紧凑型视觉-语言模型,专为文档智能处理优化,在OCR Bench v2中表现优异,支持多模态输入与灵活部署。

image.png

【AiBase提要:】

✨ 参数仅8B但性能卓越,支持多页文档、表格、图表等复杂场景。

🏆 OCRBench v2测试中登顶,展现高精度和泛化能力。

🚀 灵活部署,支持从云端到边缘设备,开源且兼容多种框架。

详情链接:https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

8、腾讯公益首次引入AI大模型,提升公益项目互动体验

腾讯公益推出“问 AI”功能,利用大型人工智能模型提升公众与公益组织的互动和透明度,同时结合AI通识公益课程拓展教育资源。

【AiBase提要:】

🌟 用户可通过“问 AI”功能即时获取腾讯公益项目信息,增强参与感。

📚 腾讯与清华大学合作推出AI通识公益课程,惠及7000余名学生。

🌐 借助AI技术,公益项目效率提升,未来创新路径拓宽。

9、Firecrawl /search API发布!一键搜索+抓取,AI数据处理进入新时代!

Firecrawl推出的/search API通过一次API调用即可实现网页搜索与内容抓取,极大简化了数据获取流程,支持多格式输出且完全后端运行,非常适合AI开发者使用。

image.png

【AiBase提要:】

🔥 一键搜索与抓取:通过一次API调用,无需手动解析复杂搜索结果,快速获取网页完整内容。

🌐 多格式输出:支持Markdown、HTML、纯链接和截图,满足不同AI模型的数据需求。

🌟 社区驱动:开源工具,GitHub获超10K Star,提供Python和Node.js SDK,降低开发门槛。

详情链接:https://github.com/mendableai/firesearch

10、语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然!

Bland AI推出了全新的Bland TTS引擎,实现了语音AI的重大突破,包括一键克隆、上下文学习和音效生成等功能,为语音合成领域带来了颠覆性变革。

image.png

【AiBase提要:】

🌟 仅需一段短音频即可精准克隆任意人声,大幅降低技术门槛。

📚 引入上下文学习,根据语义动态调整语气和情感,提升自然度。

🎶 支持音效生成,扩展至多维度声音创作,增强沉浸式体验。

详情链接:https://bland.com/enterprise

11、Mary Meeker最新报告:AI训练成本逼近百亿美元,推理成本暴跌99%

知名投资人Mary Meeker的最新AI报告揭示了AI行业面临的成本结构矛盾,训练成本持续飙升至百亿级别,而推理成本却因硬件与算法突破骤降99%,这种分化正重塑AI产业的商业化格局。

QQ20250605-142201.png

【AiBase提要:】

训练成本指数级增长,形成头部玩家才能参与的军备竞赛,将大量中小型企业挤出赛道。

推理成本因硬件迭代雪崩式下降,推动AI应用大规模普及,降低开发者创新门槛。

AI行业面临烧钱与构建技术壁垒的平衡挑战,网络效应成为可持续盈利的关键。

12、Jaaz开源AI设计Agent横空出世!一键批量生成图像,创意生产从此起飞!

Jaaz是一款开源AI设计Agent,支持通过简单的API配置实现自动化批量图像生成,为专业创作者和团队提供了高效的解决方案。

image.png

【AiBase提要:】

✨Jaaz通过简单API配置实现批量图像生成,适合快速生成大量视觉内容。

🔧当前版本API支持有限,但开源特性为未来扩展提供了可能。

🌟未来可扩展为全能型创意平台,满足多样化需求。

详情链接:https://github.com/11cafe/jaaz

13、《逆水寒》手游与可灵AI合作,上线“图生动图”玩法

《逆水寒》手游与可灵AI达成合作,推出全新“图生动图”玩法,玩家可通过简单操作将静态图片转化为动感画面,享受个性化创作的乐趣。

【AiBase提要:】

🌟玩家可轻松创作个性化动图,提升游戏趣味性。

📸支持双人互动,创造温馨有趣的亲密场景。

💰动图生成为付费服务,费用依品质与时长而定。

举报

  • 相关推荐
  • ChatGPT们重塑了对话框,钉钉今天要重塑表格

    ​自从1979年,丹·布里克林(Dan Bricklin)和鲍勃·弗兰克斯顿(Bob Frankston)在苹果当时划时代的 Apple II 电脑上做出了第一张可以自动计算和更新的电子表格 VisiCalc 后,表格就成为了计算机用数据方式理解人类世界的基座。不过,在更多的时候,没人这样讨论它。横横竖竖几个格子,表格无处不在,它看起来太普通了。 然而计算机诸多繁荣的根基,都建立在一张张表格之上,无�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 国内MCP服务器搜索引擎有哪些?MCP导航站平台推荐

    在人工智能技术蓬勃发展的今天,AI模型与外部工具和服务的交互能力正成为推动技术进步的关键。AIbase(<https://mcp.aibase.cn/>)作为一个专注于MCP(Model Context Protocol,模型上下文协议)服务器的集合平台,为全球的AI开发者和研究人员提供了一个前所未有的资源库,助力AI技术的进一步发展。 AIbase平台的核心在于其对MCP协议的深度整合。MCP协议是一种开放标准协议,允许AI模�

  • 国内eSIM回归!OPPO Watch X2系列上线中国移动一号双终端

    一号双终端业务是指用户可以在自己手机号码(主号码)的账户和套餐下,添加手表作为eSIM附属设备(副卡),使手机和手表共用一个号码,共享号码、套餐通话和流量,可分别通话、上网。 如果没有随身携带手机,用户可以通过开通eSIM业务的智能手表进行通话,也不用担心错过重要通话。 这两年国内eSIM业务逐步收紧,很多新的设备已经无法重新开通,现在终于开始重新�

  • 国内MCP资源平台有哪些?MCP工具网站推荐

    在人工智能技术飞速发展的今天,Model Context Protocol(MCP,模型上下文协议)作为一种创新的开放标准协议,正在为AI模型与外部工具和服务的交互带来前所未有的便利。今天,我们有幸深入报道一个专注于MCP服务器和相关服务的集合平台——AIbase(https://mcp.aibase.cn/)。这个平台不仅为全球的AI开发者提供了一个强大的资源库,还通过一站式整合、安全实践和开发效率工具,极大地

  • AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

    开年以来,AI 图片赛道迎来一轮小高潮。今年3月,在我们统计的月访问量超200万的 Web 端 AI 图片产品中,有45款产品访问量呈现环比上涨,最高增幅超过600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。 回顾2022年至今几轮 AI 爆款产品(如 Lensa、妙鸭相机、黏土滤镜、吉卜力),其流量爆发的逻辑始终贯穿着四大共性:操作门槛极低、个性表达鲜明、用户�

  • 中国无纸化2024年度TOP10企业重磅发布!itc保伦股份荣获全国第一!

    ITC保伦股份凭借技术实力和广泛市场覆盖,在2024年中国无纸化企业市场排名中位居榜首。其无纸化会议系统实现全流程管理,满足文档发送、阅读、共享、交流等需求,并整合会议生态,提供扩声、语音转写、视频会议等功能。公司拥有80亩工业园和16000平方米全自动生产车间,产品覆盖党政机关、法院、医院等多个领域。ITC坚持国产化研发,采用SM2、SM3、SM4国密算法保障信息安全,已成功应用于杭州亚运会等多个重要项目。随着数字化浪潮推进,无纸化作为数字化基石的重要性日益凸显,ITC将继续引领技术创新,推动行业迈向更智能、安全、普惠的未来。