首页 > 业界 > 关键词  > Moshi最新资讯  > 正文

AI日报:对标GPT-4o!开源大模型Moshi登场;Google Pixel 9新增多个AI功能;ElevenLabs发布消音神器VOICE ISOLATOR

2024-07-04 14:48 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、对标GPT-4o!开源大模型Moshi震撼登场

Moshi是一款多模态大模型,具备听、说能力,未来可能展示看的能力。Kyutai实验室发布Moshi是对AI技术的大胆尝试,展现了开源精神。用户体验方面,响应速度快,语言支持有待提高,使用便捷。Moshi的拟人化语气让对话更自然流畅,未来的迭代优化将提升回答准确度。对教育行业将产生深远影响,为学生提供循环讲解。期待更多类似产品出现,支持更多地方语言,让AI技术贴近人们生活。

【AiBase提要:】

💡多模态能力:Moshi可以听取人的语音提问后进行实时推理回答,而且它的语音模式已经开放,比GPT-4o的秋天上线要快得多。

💡无区域限制:无论你身在何处,都能使用Moshi。

💡手机移动端支持:虽然对普通话支持不太好,但用英语提问完全没问题。

💡即将开源:Kyutai计划很快开源Moshi,届时将公布代码、模型权重和论文。

详情链接:https://top.aibase.com/tool/moshi-chatMoshi

2、Google Pixel 9新功能曝光:AI加持,类似微软Recall的智能体验即将到来!

谷歌Pixel 9系列即将推出一系列令人惊艳的AI新功能,包括Add Me、Studio和Pixel Screenshots。这些功能将提升用户拍照体验、激发创意表达并注重隐私保护,展现了谷歌对AI技术的深刻理解和创新应用。期待Pixel 9系列为数字生活带来更多可能性。

【AiBase提要:】

✨ Add Me功能:捕捉每个人最佳表情,融合不同照片中的人物表情,确保每个人以最佳状态出现。

🎨 Studio功能:集成到截图编辑器应用中,让用户创建和重新混合贴纸,释放无限创意。

🔒 Pixel Screenshots功能:提供隐私保护解决方案,只在用户手动截图时工作,通过本地AI处理保障用户隐私安全。

3、AI搜索Perplexity AI发布 Pro Search:提升问题解决与代码执行能力

Perplexity近日宣布对其Pro Search服务进行重大升级,新版Pro Search不仅能处理更复杂的查询,还具备多步推理能力,为用户提供更深入、全面的研究支持。这一升级展示了AI在信息检索和问题解决领域的巨大潜力,为未来的智能研究工具设立了新的标准。

image.png

【AiBase提要:】

🔍 复杂查询处理能力提升:新版Pro Search能执行高级数学和编程计算,提供更全面的调研结果。

🧠 多步推理功能:Pro Search现在能进行多步推理,逐步实现目标,并根据发现采取智能行动。

🔢 增强的数学和编程能力:通过整合Wolfram|Alpha引擎,Pro Search在解决复杂数学问题方面的准确性和速度得到显著提升。

4、Cloudflare 推出一键阻止AI机器人网络爬虫的新方法

Cloudflare最近推出了一种新方法,可以阻止AI机器人抓取网站内容并未经允许使用数据训练机器学习模型。这项举措旨在保护内容创作者在互联网上的安全。

【AiBase提要:】

⭐️ Cloudflare 推出一键封堵 AI 网络爬虫功能,确保网站内容不被未经允许的 AI 机器人使用。

⭐️ 生成式 AI 被视为盗窃源头,各大公司纷纷采取措施阻止 AI 机器人未经授权地擅用内容。

⭐️ Cloudflare 利用机器学习模型识别和阻止伪装的网络爬虫,保障内容创作者在互联网上的权益。

5、ElevenLabs发布消音神器VOICE ISOLATOR

ElevenLabs推出的VOICE ISOLATOR是一款让音频爱好者们兴奋不已的新产品,能够消除背景噪音、提取清晰对话,让音频制作更专业化。该工具简单易用,提供多项功能如Extract vocals、音效生成等,极大地提升了音频制作效率和创意空间。ElevenLabs持续创新,为用户带来全新的音频制作可能性。

【AiBase提要:】

🎵 消除背景噪音、提取清晰对话,让音频制作更专业化

🔊 提供Extract vocals功能,增强人声,清除不需要的背景噪音

🎶 音效生成功能让用户无需费时寻找音效,提供更多创意空间

详情链接:https://elevenlabs.io/voice-isolator

6、商汤科技发布可控人物视频生成算法模型Vimi

商汤科技推出了具有里程碑意义的Vimi可控人物视频生成大模型,展现了AI技术对复杂场景的高度适应性和商汤在视频生成技术上的深厚积累。Vimi具有卓越的可控性,超越传统技术,精准操控人物表情和肢体动作,同时处理细节精细,支持沉浸式视觉体验,稳定生成高质量视频。

微信截图_20240704103219.png

【AiBase提要:】

✨ Vimi实现了前所未有的视频生成灵活性,能够接收多元化输入并精准操控人物生成目标动作匹配的视频。

🌟 Vimi突破了传统图片表情控制技术的局限,实现细腻的表情和肢体动作操控,生成符合逻辑且生动自然的视频内容。

💡 Vimi稳定生成长达1分钟的高质量视频,保持画面质量如一,展现出非凡的实力和连贯性。

详情链接:https://www.wjx.cn/vm/mhSxfGv.aspx

7、AI跳舞也疯狂?MimicMotion发布新技术 可根据任何动作引导生成任意长度的视频

MimicMotion推出的新技术“High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance”引起了业界轰动。该技术利用置信度感知姿势引导生成高质量人体运动视频,提升视频质量,手部精炼机制增强细节,灵活生成任意长度视频,应用广泛前景广阔,将在视频制作和动作捕捉领域扮演关键角色。

【AiBase提要:】

🌟 利用置信度感知姿势引导生成高质量人体运动视频

🔍 手动精炼机制专注于细节打磨,特别增强手部训练

🎥 灵活生成任意长度视频,应用前景广泛

详情链接:https://top.aibase.com/tool/mimicmotion

8、ChatGPT Mac客户端存在明文存储对话的安全问题

OpenAI最近推出的ChatGPT Mac客户端存在安全漏洞,对话以明文形式存储在计算机上,可能被恶意行为者访问。公司已发布更新加密对话记录以提高安全性。

image.png

【AiBase提要:】

🔒 对话以纯文本形式存储在计算机上,存在安全隐患。

🚫 恶意行为者或应用程序可轻松读取ChatGPT对话及其中数据。

🔑 OpenAI发布更新,加密聊天记录以提升安全性。

9、谷歌新举措:将为使用AI生成的政治广告披露信息

谷歌正在采取新举措简化广告商披露政治广告是否包含人工智能生成内容的流程。广告商选择 “修改或合成内容” 复选框后,谷歌将自动生成披露信息,提高广告透明度和可信度。

【AiBase提要:】

✨ 谷歌简化广告商披露政治广告是否包含AI生成内容的流程,提高广告透明度。

🔍 广告商选择“修改或合成内容”复选框后,系统自动生成披露信息,减轻广告商负担。

💡 披露信息将在移动设备信息流、YouTube Shorts和流媒体广告中显示,其他格式广告需广告商提供披露信息。

10、固执还是恪守?任天堂反对在游戏中使用生成式AI

任天堂总裁古川俊太郎对游戏中使用生成式人工智能发表了立场,担心侵犯知识产权,强调保持独特性。他认为任天堂拥有足够的创造力和经验,不需要依赖生成式人工智能工具。生成式AI制作的内容缺乏个性化,与任天堂注重原创性和创造力不符。未来,任天堂将谨慎对待生成式人工智能的使用,依靠团队内部的创造力和经验。

【AiBase提要:】

⭐ 任天堂反对在游戏中使用生成式人工智能,担心侵犯知识产权。

⭐ 古川强调任天堂有足够的创造力和经验创造独特游戏体验。

⭐ 生成式人工智能制作的内容缺乏个性化,任天堂注重原创性与创造力。

举报

  • 相关推荐
  • 世纪华通:市值稳坐千亿 《Kingshot》7月流水首破5000万美元

    世纪华通旗下Century Games两款出海手游《Whiteout Survival》和《Kingshot》表现亮眼。7月《Whiteout Survival》收入1.27亿美元稳居全球第三,上线两年保持稳健;《Kingshot》上线5个月收入突破5300万美元,环比增长43%排名第11位。世纪华通股价随之上涨,市值重回千亿。两款产品成功印证了中国游戏出海的实力,其中《Kingshot》已进入39个地区iOS畅销榜TOP10。公司上半年业绩预告显示营收同比增长83.27%,净利润增幅超107%,研发运营一体化优势显著。中国自研游戏上半年海外收入达95亿美元,同比增长11.07%,世纪华通通过多元化产品矩阵持续领跑。

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

  • 从AI耳机到智能伙伴:WISHEE联合阿里云,在WAIC带来“云+端”的智慧进化

    2025世界人工智能大会(WAIC)上,WISHEE+AI耳机凭借全球首创多模型架构(mMA)和全场景独立智能体设计成为焦点。该产品突破单一AI能力边界,动态调度DeepSeek、Minimax、通义千问等顶尖模型协同工作:深度推理、实时检索、创意生成各司其职。通过"云+端"融合重塑服务边界,实现脱离手机的独立智能体验——内置Personal OS系统,支持语音对话、周边推荐、音乐播放等功能。13.4mm进口桑蚕丝双振膜单元提供录音棚级音质,按住耳机即可随时开启语音交互。现场还演示了即将上线的全球翻译官和会议纪要功能,展现AI如何以"交响智慧"重塑工作与沟通本质。

  • 三星彩色电子纸 E-Paper与NONO SHOP携手:打造可持续生活空间

    文章介绍了消费者对优质生活的重新定义,不再满足简单消费,而是追求环保可持续的生活方式。三星推出的彩色电子纸EMDX系列作为新一代数字标牌解决方案,能显著降低数字广告能耗。零废弃商店NONO SHOP率先采用该设备,为店铺运营降本增效,同时践行环保理念。电子纸采用环保材料设计,支持移动程序实时更新内容,无需印刷,大幅减少资源浪费。该技术不仅降低能耗,还提升运营效率,实现与消费者价值观的共鸣。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

  • 微云全息(NASDAQ: HOLO):引领比特币革命, SHA-256算法铸就交易安全与区块链坚不可摧的基石

    文章探讨了比特币在加密货币领域的核心地位,重点分析了其基于SHA-256算法的安全机制。微云全息(NASDAQ:HOLO)通过硬件加速技术(GPU/ASIC)和算法优化,显著提升了SHA-256的计算效率与稳定性。同时,该公司创新性地优化了区块链结构,引入区块索引和跨链验证机制,并采用先进的数据压缩技术,提高了存储和传输效率。这些技术创新不仅增强了比特币网络的安全性和运行效率,也为整个区块链行业的健康发展提供了技术支持。微云全息表示将持续深耕加密技术研究,推动构建更安全、高效的数字世界。

  • OMOSHIROYI百家号社会领域权重排名,百家号怎么赚钱?百家号收益上涨攻略

    OMOSHIROYI是当前百家号中的普通号,目前账号百家号权重为1,综合排名位列987019名,社会分类排名位列115983名,领先了11.2%的百家号。 OMOSHIROYI百家号概况 OMOSHIROYI的简介为IT行为研究|工业互联网|人文地理|好玩,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过0篇的游戏内容,最近该作者创作的文章中暂无热点词。 站长之家百家号传媒平台对OMOSHIROYI的运营数据估算如下: 预估总阅读数:

今日大家都在搜的词: