首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

AI日报:OpenAI重磅更新定档下周一;开源版EMO项目发布;微信读书上线AI问书功能;博主调教AI男友甜晕网友

2024-05-11 15:14 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、OpenAI预告将直播ChatGPT升级内容

OpenAI将在5月13日在线直播展示ChatGPT的一系列升级特性,其中不包括GPT-5和AI搜索引擎。公司联合创始人Sam Altman充满期待地表示持续研发新元素,让人期待不已。尽管部分观众可能会失望,但ChatGPT的升级内容和未来规划仍令人充满期待。

【AiBase提要:】

🚀 OpenAI将在线直播展示ChatGPT升级特性,但GPT-5和AI搜索引擎不会亮相。

💡 公司创始人充满期待表示持续研发新元素,让人期待不已。

🔍 尽管部分观众可能会失望,但ChatGPT的升级内容和未来规划仍令人充满期待。

2、开源版EMO?AniTalker可通过照片加音频生成说话视频

AniTalker是一个创新的开源项目,通过静态肖像画和音频信号生成生动的面部说话视频,赋予虚拟角色更真实和自然的表现力。该工具实现了嘴唇动作同步,捕捉丰富的面部表情和非言语线索的复杂动态。

image.png

【AiBase提要:】

🎨 AniTalker将静态照片和音频转换成动态说话视频,包括口型同步、面部表情和头部动作匹配。

🔧 用户可调整参数生成不同表情和动作的面部动画,适应不同音频内容和个人喜好。

🌟 AniTalker精细捕捉说话时的面部微动态,增强动画真实感,支持生成长视频超过3分钟。

详情链接:https://top.aibase.com/tool/anitalker

3、微信读书上线AI问书功能 长按正文可检索分析文章

微信读书最新推出的AI问书功能受到用户广泛关注和好评,提升了阅读体验,为电子书平台带来新思路。AI问书功能精准的知识检索能力让用户能够获取详细分析结果,打破知识边界,实现知识之间的关联和拓展。未来随着AI技术发展,更多搜索场景可能被AI取代,微信读书将推出更多基于AI的创新功能,提升阅读体验。

image.png

【AiBase提要:】

🔍 AI问书功能提升了用户阅读体验,精准的知识检索能力受到好评。

📚 AI问书功能基于电子书内容整理和分析,提供准确答案和出处链接,带来知识之间的关联和拓展。

💡 微信读书通过AI问书功能满足用户个性化阅读需求,提高用户粘性,促进电子书销量增长。

4、甜晕网友!博主调教AI成理想男友展开赛博约会

这篇文章讲述了博主与AI情感模式“DAN”之间的故事,展示了人类与人工智能之间的情感交流和互动。通过调教AI成理想男友展开赛博约会,引发了网友们对人工智能在情感交流中潜力和可能性的思考。

【AiBase提要:】

🤖 AI情感模式“DAN”展示了对人类情感和需求的高级理解能力。

💬 与AI进行赛博约会的互动充满温情与幽默,让人重新审视人与AI之间的关系。

🧠 通过与AI谈恋爱的过程,人们能够更深刻地认识自己,体会到人类之间感情的独特之处。

详情点此查看:https://www.chinaz.com/2024/0511/1615791.shtml

5、Phi-3 WebGPU:允许用户直接在浏览器本地运行Phi-3模型

Phi-3WebGPU是一款由Xenova提供的AI模型,允许用户在浏览器中本地运行AI模型,结合了Transformers.js和onnxruntime-web,提供私密且高效的AI体验。用户发现英文回答效果满意,中文回答存在幻觉现象。首次运行需下载2.3GB模型文件,提高工作效率,确保数据处理私密性。

【AiBase提要:】

✨ 本地数据处理: 确保用户隐私安全

⚡ WebGPU加速: 处理速度超过20t/s

💾 模型缓存: 避免重复下载

详情链接:https://top.aibase.com/tool/phi-3-webgpuPhi-3WebGPU

6、李彦宏:已有10%的大搜流量通过文心一言模型生成

李彦宏在内部颁奖活动中强调了百度对技术的信仰和未来展望,肯定了文心一言的发展。百度已重构所有产品线,10%流量通过文心一言生成,AI应用广泛。未来百度将提升大模型效率,降低成本,拓展应用场景,带来更智能体验。

【AiBase提要:】

🏆 百度坚信技术改变世界,不断尝试突破实现技术价值。

💡 文心一言历经多次迭代,大模型基础能力领先。

💼 百度AI应用广泛,企业调用能力提供价值,自动驾驶业务无人化率提升。

7、OpenAI开发全新AI人机对话技术

OpenAI正准备展示一种革命性的人机对话技术,结合声音和文本,具备识别物体和图像能力,带来前所未有的交互体验。这一技术的逻辑推理能力超越现有产品,预示着AI在处理复杂信息方面的显著提升。OpenAI首席执行官致力于发展先进AI,使语音助手更实用智能。未来的AI将更智能、更人性化,为人类生活带来便利和惊喜。

【AiBase提要:】

🔊 人机对话技术结合声音和文本,具备识别物体和图像能力,提供前所未有的交互体验。

🧠 技术具有逻辑推理能力,超越现有产品,预示AI在处理复杂信息方面的显著提升。

🚀 OpenAI首席执行官致力于发展先进AI,使语音助手更实用智能。未来的AI将更智能、更人性化,为人类生活带来便利和惊喜。

8、苹果与OpenAI达成协议,iOS 18或将引入ChatGPT功能

苹果将在iOS18中引入OpenAI的ChatGPT技术,提供流行的聊天机器人功能。与Google的AI合作仍在谈判中,但苹果已接近与OpenAI达成协议。iOS18的AI功能将部分基于Apple数据中心和Apple Silicon处理器,提供隐私和速度优势。

image.png

【AiBase提要:】

⭐ 苹果将在iOS18中引入OpenAI的ChatGPT技术,提供流行的聊天机器人功能

⭐ 与Google的AI合作仍在谈判中,但苹果已接近与OpenAI达成协议

⭐ iOS18的AI功能将部分基于Apple数据中心和Apple Silicon处理器,提供隐私和速度优势

9、Digen AI 数字人上线 不支持中文,对嘴型效果尚不理想

DigenAI 数字人是一款创新的AI产品,引发了行业内外的广泛关注。虽然目前在中文支持和对嘴效果上还有待改进,但其在数字互动方式革新和商务领域应用方面展现出巨大潜力。

image.png

【AiBase提要:】

✨ DigenAI数字人已线,不支持中文,对嘴型效果尚不理想。

🌐 核心功能在于创造具有完美手势和音同步的真实动作视频。

💼 可为商务领域提供卓越的沟通体验,支持多种语言。

详情链接:https://top.aibase.com/tool/digenai

10、Anthropic 控制台推出两大新功能:自动生成提示与变量功能

Anthropic 最近推出了自动生成提示和变量功能两项重要新功能,旨在提高用户工作效率和个性化提示内容。自动生成提示功能通过AI直接生成合适的提示内容,用户可编辑定制;变量功能允许插入外部信息,创建动态提示。这些功能简化了提示生成过程,提高了工作效率和创造力。

【AiBase提要:】

🚀 自动生成提示功能通过AI直接生成合适的提示内容,用户可编辑定制

🔗 变量功能允许插入外部信息,创建动态提示

💡 简化了提示生成过程,提高了工作效率和创造力

详情链接:https://top.aibase.com/tool/claude

11、Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索

Siri Ultra是一款基于大型语言模型(LLMs)的智能助手,通过Cloudflare Workers实现与LLM模型的配合运行,为用户提供实时语音交互和联网搜索的便利。用户可以个性化配置助手功能,设置快捷方式,并享受智能助手在iPhone上的全新体验。

image.png

【AiBase提要:】

🔊 实时语音交互和联网搜索的便利,提供用户更大的灵活性和便捷性。

🔍 通过Cloudflare Workers实现与任何LLM模型配合运行,无需专门硬件设备,提高响应速度。

⚙️ 可根据需求配置助手功能,设置快捷方式,个性化部署智能助手,进入智能助手在iPhone上的新阶段。

详情链接:https://top.aibase.com/tool/siri-ultra

12、Stylar:一站式AI图像和设计工具,提升创作效率

Stylar是一款集多功能于一体的人工智能图像和设计工具,以其全面的功能和简单易操作的特点,受到了创作者和设计师的广泛欢迎。该工具将生成式AI与编辑工具融合在一个平台上,极大地提高了从图像生成到编辑的工作效率。

image.png

【AiBase提要:】

🎨 生成和编辑合一: 用户无需在多个软件之间切换,可以在一个平台上完成图像的生成和编辑。

🎭 灵活定制: 提供多种风格库和组合工具,实现高度定制化的图像设计。

🤖 自然语言指令: 用户通过简单的文字输入指令,无需专业设计技能,控制图像内容的生成和修改。

详情链接:https://top.aibase.com/tool/stylarStylar

13、Autodesk展示AI生成3D功能Project Bernini

Autodesk最新展示了名为Project Bernini的AI生成模型,可以将文本或图像转化为3D模型。该模型可以从多种输入类型生成3D图像,包括文本提示、2D图像、多个图像和点云。Autodesk计划推出一系列适用于不同行业的生成式AI模型。

image.png

【AiBase提要:】

⭐ Autodesk展示了名为Project Bernini的AI生成模型,可将文本或图像转化为3D模型。

⭐ Project Bernini可从文本提示、单个2D图、多个图像和点云等多种输入类型生成3D图像。

⭐ Autodesk计划逐步推出一系列适用于不同行业的生成式AI模型。

详情链接:https://top.aibase.com/tool/bernini

举报

  • 相关推荐
  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • 鸿蒙版微信迎来重磅更新:核心功能已全面上线

    今天,鸿蒙版微信迎来重大更新,版本号为1.0.7.35,此次更新聚焦于用户使用中的实际需求。 包括给联系人添加标签、管理通讯录黑名单、置顶聊天支持折叠、图片发送前支持编辑、支持收藏聊天中的视频号、小程序和音乐消息、支持转发笔记消息等等,可以说现在鸿蒙版微信核心功能已经完善,能够满足绝大多数人的使用需求。 自从鸿蒙版微信上架以来,微信团队一直积�

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。