AI日报：一夜封王！AI模型Claude 3.5来了；腾讯元宝支持千万字文本；Groq上线超强语音转录模型

2024-06-21 15:01 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、研究生级别推理！Anthropic发布Claude 3.5 Sonnet模型可在聊天窗口运行代码

Anthropic今日宣布推出Claude 3.5 Sonnet，这是Claude 3.5 系列中的首款产品。该模型在多项评估中均优于竞争对手及其前身Claude 3 Opus，同时保持了与中端型号相当的速度和成本，树立了行业新标准。Claude 3.5 Sonnet在研究生水平推理、本科生水平知识和编码能力等方面创下新的行业基准，性能大幅提升。

【AiBase提要:】
⭐性能提升:在推理、知识掌握和编码能力等多个评估方面表现出色。
⭐运行速度和成本:运行速度是前代Claude3Opus的两倍，而成本仅为其五分之一，提供了极高的性价比。
⭐理解能力增强:在解释图表和图形等需要视觉推理的任务中表现尤为出色，还能准确地从不完美图像中转录文本
⭐新功能Artifacts允许用户要求Claude生成代码片段、文本文档或网站设计等内容
详情点此了解：https://mp.weixin.qq.com/s/GIh5YZwIyw2qIj2Mtjej4g

2、北京首例AI换脸软件侵权案宣判

在北京互联网法院审理的首例AI换脸软件侵权案中，法院认定被告侵犯了原告的个人信息权益，但未构成对原告肖像权的侵犯。案件涉及深度合成技术和个人信息保护法，引发了对换脸技术合法性和隐私权保护的讨论。

【AiBase提要:】
🔍 法院认定被告侵犯原告的个人信息权益，但未触及肖像权问题。
💡 换脸模板视频不具有肖像意义上的识别性，未构成对原告肖像权的侵犯。
💻 被告的行为涉及个人信息处理，侵犯了原告的个人信息权益。
详情：https://www.chinaz.com/ainews/9700.shtml

3、腾讯元宝发布全新版本接入微信搜索

腾讯元宝近期发布了全新版本，主要提升了对超长文本的处理能力及AI搜索和解析功能，增加了微信搜索接入，为用户带来更高效便捷的使用体验。此次更新不仅提升了处理超长文档效率，还丰富了文件格式支持，图表生成和图片解析功能。新版本还增强了搜索功能，接入微信搜索等搜索引擎，提供更全面的服务。

【AiBase提要:】
🚀 提升超长文本处理能力，支持处理长达1000万字的单文档文本。
📊 多文件解析，一次性解析多达50个文件，支持多种文件格式。
🔍 增强搜索功能，集成微信搜索等搜索引擎，提供智能搜索结果。
详情链接:https://top.aibase.com/tool/tengxunyuanbao

4、知网宣布推出CNKI AI学术研究助手4.0

中国知网最近推出了AI学术研究助手4.0版本，结合AI大模型技术和高质量数据，提升文献检索、研读和学术创作效率。新增功能包括可控生成、文献扩展、学者检索、全文翻译和学术拓展服务，满足用户个性化需求。突出升级是问答式增强检索和学者检索服务。体验地址：https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

【AiBase提要:】
🔍 AI学术研究助手4.0版本结合AI大模型技术和高质量数据，提升文献检索、研读和学术创作效率。
🔄 新增功能包括可控生成、文献扩展、学者检索、全文翻译和学术拓展服务，满足用户个性化需求。
🔗 突出升级是问答式增强检索和学者检索服务，提供更精确的答案和详细学者信息。
详情链接:https://top.aibase.com/tool/zhiwangcnki-ai-xueshuyanjiuzhushou

5、Groq上线whisper-large-v3模型，支持语音转录和翻译、免费开放

Groq最新推出的Whisper Large-V3模型为用户提供了强大的语音转录和翻译功能，可在Playground或本地项目中使用API。用户体验高速转录，支持多种语言翻译成英文。Whisper API兼容OpenAI标准，提供语音转文本和翻译功能，便于集成到应用程序中。性能优越，采用先进的"whisper-large-v3"模型。

【AiBase提要:】
🔊 高速转录：4分30秒视频仅需约3秒转录时间。
🌐 多语言支持：支持多种语言转录和翻译成英文。
🛠️ API接口：提供语音转文本和翻译功能，可集成到应用程序中。
详情链接:https://console.groq.com/playground

6、复旦开源项目Hallo已适配ComfyUI插件

Hallo项目是一个根据音频和图片生成说话视频的开源项目，虽然安装门槛较高，但为转绘和其他流程提供了更多可能性和乐趣。它采用端到端的扩散范式，引入分层的音频驱动视觉合成模块，实现音频输入与视觉输出的对齐精度，生成自然的说话视频。尽管安装复杂，但为开源生态注入新活力，展望未来会有更多类似项目带来便利和乐趣。

【AiBase提要:】
🔊 Hallo项目适配ComfyUI插件，通过音频和图片生成自然说话视频。
🎤 采用端到端扩散范式，引入分层音频驱动视觉合成模块，提高对齐精度。
😊 分层音频驱动模块实现表情和姿势多样性控制，个性化定制，生成自然效果。
详情链接:https://github.com/AIFSH/ComfyUI-Hallo

7、AI工具Perplexity被指责在禁止情况下仍继续抓取网站内容

Perplexity是一家AI初创公司，以革新的网络信息交互方式重塑在线阅读体验。然而，他们绕过Robots Exclusion Protocol获取受限网络内容，引发争议。尽管CEO为公司做法辩护，但面临版权问题批评。Perplexity的行为在数字媒体领域引发伦理和法律难题。

【AiBase提要:】
🤖 Perplexity绕过Robots Exclusion Protocol获取受限网络内容，引发争议。
💼 CEO为公司做法辩护，但面临版权问题批评。
⚖️ Perplexity的行为在数字媒体领域引发伦理和法律难题。

8、乌克兰网红遭AI盗脸后续：投诉后，使用其形象公司已删除相关图像

21岁的乌克兰YouTube博主Olga Loiek最近发现有人利用AI克隆了她，并且这些克隆形象在网络上被滥用。克隆者不仅利用AI技术制作了大量视频，还声称这些视频中的角色是俄罗斯人，这显然是虚假的。事件引发了对AI技术使用的法律和伦理问题的讨论，特别是在个人隐私和形象权保护方面。

【AiBase提要:】
🔍 克隆现象滥用：4900个以上克隆视频，虚假信息传播，涉及欺诈行为。
🛡 形象权侵犯：多变形象侵权，可能误导公众，引发法律讨论。
⚖ AI技术挑战：需警惕滥用风险，保护个人权益，引发伦理问题讨论。
详情：https://www.chinaz.com/ainews/9707.shtml

9、强强联合！环球音乐联手AI音乐初创公司SoundLabs 为歌手定制自己的语音克隆模型

环球音乐集团与AI音乐技术公司SoundLabs合作推出MicDrop功能，让艺术家定制个性化语音模型，拥有完全控制权，突破语言障碍，保护艺术家权利。这一革命性技术将音乐创作带入全新的创意空间，推动AI在音乐领域的应用和发展。

【AiBase提要:】
🎤 艺术家定制语音模型，拥有完全控制权，确保所有权和使用权归属明确。
🎸 MicDrop功能可将语音转乐器，提供更多音乐创作灵活性和创意空间。
🌍 语言转换功能帮助艺术家突破语言障碍，全球发行音乐，扩大受众群体。

10、包治后悔？Agent智能体或成618剁手后的AI解药

Agent智能体成为618剁手党的救赎，带来消费决策的革新。智能体平台如雨后春笋，一键召唤不同智能体协作，打造个性化智能助手。AI导购智能体与电商结合，创造新商业模式。

【AiBase提要:】
🤖 Agent智能体成为消费决策的新利器，改变剁手党的购物方式。
🔍 智能体平台涌现，一键召唤不同智能体协作，提供个性化智能助手服务。
💡 AI导购智能体与电商结合，展示更精准的消费建议，创造新的商业模式。

11、GaussianCube：高质量3D生成建模，性能飞跃74%！

三维生成建模领域迎来了突破性进展，GaussianCube技术超越了传统NeRF，革新了3D建模。该技术采用密度约束高斯拟合算法，简化了建模过程，实现了高精度拟合。实验结果显示高达74%的性能提升，证明了其巨大潜力。

【AiBase提要:】
🌐 GaussianCube: 一种新型的显式结构化三维表示方法。
🔧 创新算法: 密度约束高斯拟合与最优传输算法结合。
🎛️ 简化建模: 直接应用标准3D U-Net网络，无需复杂设计。
详情链接:https://top.aibase.com/tool/gaussiancube

12、前Twitter工程师开发AI新闻阅读器Particle NEW获千万美元融资

Particle是由前Twitter工程师Sara Beykpour和Marcel Molina创立的初创公司，旨在重新定义新闻阅读体验。他们利用人工智能技术打造个性化新闻平台，与全球新闻巨头合作，避免信息孤岛，提供优质内容和阅读体验。Particle获得千万美元融资，备受资本青睐。

【AiBase提要:】
🚀 个性化新闻平台，快速精准，与全球新闻大腕合作，确保内容深度和广度。
💡 AI技术智能避免信息孤岛，打破推特回音室效应，拓展世界观。
💰 确保内容创作者公平报酬，提供优质内容，AI应用增强阅读体验。
详情链接:https://particlenews.ai/

13、研究表明：81%用户认为AI工具提升了工作效率和质量

根据最新调查显示，越来越多的办公人员开始使用AI工具，认为AI不仅提高了工作效率，还提升了工作质量，推动了生产力的加速增长。调查结果显示，使用AI的员工在工作效率、工作质量以及工作与生活平衡等方面都表现出更高的得分，展现出对AI技术的热情和接受度。

【AiBase提要:】
📈 AI工具提升工作效率和质量
👩‍💼 高管迫切整合AI工具到业务运营
🔥 全球办公人员对AI处理工作任务表示热情

14、AI视频初创公司HeyGen融资6000万美元，估值超5亿美元

HeyGen在A轮融资中成功筹集了6000万美元，公司估值超过5亿美元，展示了AI技术在视频制作领域的广泛应用潜力。其盈利能力强劲，年收入从100万美元增长至超过3500万美元，客户群体覆盖小型企业到财富500强公司。HeyGen计划扩大产品供应并投资于企业安全、AI伦理、信任和安全方面。

【AiBase提要:】
💰 HeyGen完成6000万美元A轮融资，估值超过5亿美元
📈 年收入从100万美元增长至3500万美元以上
🛍️ 客户包括小型企业和财富500强公司

（举报）

相关推荐

关键词：

Claude

荐Claude竟藏着3307种「人格」？深扒70万次对话，这个AI会看人下菜碟

Anthropic公司通过分析70万条Claude AI对话数据，发现其AI助手展现出独特的价值观体系。研究显示Claude遵循"乐于助人、诚实无害"的核心价值观，同时能根据不同场景灵活调整回应方式。AI表现出3307种价值观，分为实用性、认知性、社会性等五大类，其中28.2%对话强烈支持用户价值观，3%会明确抵制不当观点。研究还发现高价版AI模型价值观表达更强烈，在学术严谨性和情感�

AI对话价值观隐私
荐AI日报：字节发布豆包1.5深度思考模型；微信首个AI助手 “元宝” 上线；OpenAI发布o4-mini、满血版o3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布两款多模态推理模型o4-mini、满血版o3OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3，这两款模型具备同时处理文本、图像和音频的能力，并能调用外部工�

人工智能多模态模型 OpenAI
腾讯元宝是真“AI下乡”了：直接干到村口给乡亲开课！

快科技4月8日消息，据媒体报道，近日，腾讯元宝AI下乡”了，直接干到广东省紫金县村口开课，手把手教村民用AI。据网友发布图片显示，就连母猪产后护理难，问腾讯元宝”这标语也被刷到了墙上。这说明什么问题？说明国内AI公司开始认真研究刚需”了。毕竟在农村，最实在的需求可能就是怎么把猪养好”，这直接关系到农民的钱袋子。在腾讯AI下乡课堂上，村民种植的百�

腾讯元宝 AI下乡农村发展
荐AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

本文汇总了AI领域最新动态：1)小米开源70亿参数大模型Xiaomi MiMo，在数学推理和代码竞赛中超越OpenAI和阿里模型；2)快手推出AI笔记工具"喵记多"，简化笔记管理；3)Luma AI发布电影级镜头控制API，降低视频生成门槛；4)腾讯重组AI团队，加大语言模型研发投入；5)Anthropic为Claude引入新语音"Glassy"；6)谷歌NotebookLM新增50+语言音频概述功能；7)xAI将发布Grok3.5模型；8)Meta推出独立AI助手应用挑战ChatGPT；9)OpenAI紧急修复GPT-4o"谄媚"问题；10)Mac本地AI助手Simular升级隐私保护；11)CameraBench项目帮助AI理解镜头运动；12)谷歌推出个性化语言学习AI工具。

人工智能 Xiaomi MiMo
荐“血亏，我花3000+元用Claude做游戏，结果还不如去「白嫖」Gemini 2.5……”

作者分享使用AI助手开发拼字游戏的两段经历：首次用Claude花费417美元(约3042元)，开发过程充满痛苦，常出现上下文失效、代码错误等问题；第二次用Gemini 2.5 Pro+Cursor完全免费，体验明显改善，能更好理解项目上下文，开发更流畅。对比指出：Claude像健忘的实习生，常搞砸项目；Gemini则像可靠的中级工程师，开发速度快且稳定。但强调AI仍需人类监督测试，无法独立产出完美代�

拼字游戏 AI编程 Claude
荐AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

本期AI日报聚焦多项AI技术突破与应用：1)Moonshot AI推出开源音频模型Kimi-Audio，基于13亿小时训练数据，支持语音识别等任务；2)阶跃星辰开源图像编辑模型Step1X-Edit，展现强大生成能力；3)夸克AI上线"拍照问夸克"功能，实现视觉问答；4)苹果iOS18.5将在中国推送，带来智能功能；5)谷歌发布601个生成式AI应用案例，覆盖多行业；6)微软推出深度整合Windows的UFO²自动化系统；7)OpenAI升级ChatGPT至GPT-4o版本，提升STEM领域能力；8)Ema公司推出高性价比语言模型EmaFusion；9)Liquid AI发布面向边缘设备的Hyena Edge模型；10)LemonAI推出实时音视频数字人产品Slice Live。此外，国内方面，智谱与生数科技达成战略合作推动大模型发展，宝马中国宣布新车将接入DeepSeek技术。

AI日报音频技术开源模型
荐Claude终于能Research了，打通谷歌全家桶，工作效率10倍提升

Anthropic推出Claude两大重磅功能:Research与Google Workspace集成!Research功能让Claude快速检索网络与内部文件，精准回答复杂问题;而与Google Workspace的深度整合，则让用户能无缝调用Gmail、日历和文档信息，轻松完成从行程规划到报告撰写的任务。今天凌晨，Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。Anthropic称Research功能是与Claude合作的新方式。它能从多个角度分析

Claude Anthropic Research功能
荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型，并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议，支持商业用途，提升了

人工智能开源模型 GLM模型
荐AI日报：kimi宣布降价；OpenRouter发布免费模型Quasar Alpha；Midjourney V7重磅上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、IDC:到2028年中国人工智能投资将突破1000亿美元根据国际数据公司的预测，中国在人工智能领域的投资将显著增长，预计到2028年总投资将突破1000亿美元，年均复合增长率达到35.2%。

人工智能投资预测生成式AI
最新AI资讯日报平台推荐 AI日报周报合集去哪看？

AIbase基地是一个专注于人工智能领域的综合性平台，致力于为用户提供丰富的AI资讯、工具和资源，帮助用户更好地了解和探索人工智能的前沿动态和发展趋势。无论是关注行业动态、学习AI技术是寻找AI产品和项目，AIbase基地都能满足用户的需求，是通往AGI之路上的一个重要助力。数据可视化:通过各种榜单的形式，将复杂的AI产品和项目数据进行可视化展示，使用户能够更加直观地了解市场趋势和行业动态，便于做出决策。

人工智能 AI新闻 AI工具

热文

3 天
7天

AI日报：一夜封王！AI模型Claude 3.5来了；腾讯元宝支持千万字文本；Groq上线超强语音转录模型

荐Claude竟藏着3307种「人格」？深扒70万次对话，这个AI会看人下菜碟

荐AI日报：字节发布豆包1.5深度思考模型；微信首个AI助手 “元宝” 上线；OpenAI发布o4-mini、满血版o3

腾讯元宝是真“AI下乡”了：直接干到村口给乡亲开课！

荐AI日报：小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”；腾讯拆分AI团队

荐“血亏，我花3000+元用Claude做游戏，结果还不如去「白嫖」Gemini 2.5……”

荐AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

荐Claude终于能Research了，打通谷歌全家桶，工作效率10倍提升

荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

荐AI日报：kimi宣布降价；OpenRouter发布免费模型Quasar Alpha；Midjourney V7重磅上线

最新AI资讯日报平台推荐 AI日报周报合集去哪看？

热文

印度将中国电子投资压股至 10%，且要求“技术转让”

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

累了倦了就找 ChatGPT……AI正在沦为“情绪垃圾桶”！

美国网购市场动荡，希音、Temu 率先在美开启“涨价潮”！

站长商机