首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

AI日报:​谷歌发布全新Gemma 2 2B模型;字节推AI音乐产品海绵音乐;Runway推Gen-3 Alpha Turbo 版本;华为Pura 70系列上线AI扩图

2024-08-01 14:45 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、谷歌发布全新Gemma2 2B模型,性能超越GPT-3.5-Turbo与Mixtral-8x7B

谷歌推出了性能卓越的Gemma2 2B模型,拥有20亿参数,在多种硬件环境下表现优异。配备了ShieldGemma安全分类器和Gemma Scope工具,助力研究人员进行内容过滤与决策分析。在激烈竞争中取得重要突破,展现出对AI技术发展的持续努力。

image.png

【AiBase提要:】

🌟 Gemma2 2B模型拥有20亿参数,在多种硬件环境下表现优异,已超越GPT-3.5-Turbo等多款模型。

🔍 新模型配备了ShieldGemma安全分类器和Gemma Scope工具,助力研究人员进行内容过滤与决策分析。

🚀 谷歌需要加速推出Gemma3,以维持市场竞争力。

2、媲美Suno!字节推AI音乐产品海绵音乐:输入灵感一键生成音乐

海绵音乐是一款与Suno媲美的AI音乐创作工具,让每个人都能轻松实现音乐梦想。通过输入灵感或歌词,海绵音乐快速生成音乐作品,拉近普通人与音乐创作的距离,让创作更亲民。提供丰富的自定义功能,支持多种音乐风格,让用户享受独特的音乐创作体验。

【AiBase提要:】

🎵 利用AI技术,轻松创作音乐,只需输入灵感或歌词。

✨ 提供丰富的自定义功能,支持多种音乐风格,满足个人创作需求。

💡 创作过程中发现新灵感,享受独特的音乐创作体验。

详情链接:https://top.aibase.com/tool/haimianyinle

3、阿里巴巴预计将在9月推出AI人工智能对话式采购引擎

阿里巴巴国际数字商业集团计划推出创新的人工智能对话式采购引擎,旨在革新B2B电子商务的采购体验,特别服务中小企业。引擎整合多个电商平台,通过AI技术解析自然语言,提供精准采购需求转化。具备强大数据分析能力,预测采购趋势,个性化建议助企业智能决策。

【AiBase提要:】

🚀 引擎将革新B2B电子商务采购体验,专注中小企业服务。

💬 整合多电商平台,通过AI技术解析自然语言,提供精准采购需求转化。

📊 具备强大数据分析能力,预测采购趋势,提供个性化建议助企业智能决策。

4、Runway宣布推出Gen-3 Alpha Turbo 版本

Runway最近在社交平台X上发布了令人振奋的消息,即将推出全新的AI视频模型Gen-3Alpha Turbo,以显著降低的价格面世。这一举措将为AI视频创作领域注入新的活力,同时也引发了关于技术创新与版权保护之间平衡的讨论。

【AiBase提要:】

🚀 Gen-3Alpha Turbo模型生成视频速度比之前的Gen-3Alpha快了整整7倍,保持了优秀的性能表现。

💰 Runway降低价格推出新模型,可能是为了拓展更广泛的应用和创造更多整体收入。

🔍 Runway面临版权纠纷,计划从YouTube频道抓取内容训练AI模型,引发争议但未正面回应。

详情链接:https://top.aibase.com/tool/runwayml

5、360悬浮球将换成AI助手:集成15家最强大模型

在ISC.AI2024第十二届互联网安全大会上,周鸿祎宣布360悬浮球将换成AI助手,并新增AI助手悬浮按钮。AI助手与15家顶尖大模型公司合作,全面整合到360的国民级入口产品中,用户无需安装插件即可使用。周鸿祎强调AI助手提供一站式体验,让用户接触到国内最强大的AI模型,选择最合适的模型进行效果对比和交叉验证,以挑选最满意的解决方案。

【AiBase提要:】

🤖 AI助手与15家顶尖大模型公司合作,全面整合到360的国民级入口产品中,用户无需安装插件即可使用。

🔍 用户可以根据自己的需求选择最合适的AI模型,进行效果对比和交叉验证,以挑选最满意的解决方案。

🖥️ 360悬浮球将换成AI助手,并新增AI助手悬浮按钮,提供更便捷的AI功能体验。

6、华为Pura 70系列手机新增AI扩图功能

华为Pura 70系列手机在升级到HarmonyOS4.2.0.172版本后,新增了令人瞩目的AI扩图功能,为用户带来更丰富和有趣的摄影体验。用户可以轻松享受AI技术带来的创作乐趣,拯救废片,释放创意潜力。

image.png

【AiBase提要:】

✨ AI扩图功能让用户能智能理解图片内容,填补空白区域,提供更广阔的视野。

⚙️ 使用简单便捷,用户只需打开照片应用,选择编辑功能,点击AI修图,选择扩图即可。

📸 AI扩图功能将在2024年8月底前支持Pura70及Pura70北斗卫星消息版,基于先进的AI构图算法与图像生成技术。

7、马斯克回应xAI考虑收购Character.AI:并未考虑收购

马斯克旗下的xAI公司并未考虑收购Character.AI,这一举动是为了进一步测试和开发自家的Grok聊天机器人。Character.AI由谷歌员工创立,提供设计个性化聊天机器人和AI助手的平台,吸引了大量年轻用户。

【AiBase提要:】

✨ xAI公司未考虑收购Character.AI,专注测试和开发Grok聊天机器人。

💡 Character.AI由前谷歌员工创立,提供设计个性化聊天机器人和AI助手的平台。

🌟 Character.AI的产品有免费和付费版本,付费版每月订阅费用为9.99美元。

8、打开语言模型“黑箱”!Google DeepMind 发布一套可视化工具Gemma Scope

在人工智能的世界里,语言模型如同一个深不可测的黑箱,我们投入文字,它吐出意义。Google DeepMind的最新研究——Gemma Scope,为我们揭开了这个黑箱的一角。通过稀疏自编码器的训练,Gemma Scope揭示了语言模型激活背后的真实意义,为AI的可解释性和安全性迈出重要一步。

【AiBase提要:】

🔍 Gemma Scope通过稀疏自编码器揭示语言模型激活背后的真实意义

🧠 JumpReLU SAEs控制激活,优化重建损失并正则化潜在特征数量

📊 Gemma Scope在不同数据集子集中表现优异,尤其在DeepMind mathematics上表现最佳

详情链接:https://storage.googleapis.com/gemma-scope/gemma-scope-report.pdf

9、百胜旗下品牌Taco Bell在美国100多个门店测试AI点餐服务

Taco Bell的母公司Yum! Brands正在测试在门店引入语音AI点餐服务,旨在提高订单准确性、缩短等待时间,减轻员工负担,以赚取更多利润。快餐业AI实验结果参差不齐,麦当劳撤回计划,Wendy's满意。推广规模相对较小,测试已持续约两年,技术也推广至澳大利亚肯德基。

【AiBase提要:】

😜 Taco Bell母公司计划年底前将语音AI技术引入数百家门店。

😕 快餐业AI实验结果有喜有忧,麦当劳撤回计划,Wendy's满意。

🤔 美国Taco Bell店众多,此次推广规模较小,测试已持续约两年,技术还推广至澳大利亚肯德基。

10、TikTok每月支付近2000万美元 成为微软最大 AI云计算客户之一

TikTok每月向微软支付近2000万美元以访问OpenAI的人工智能模型,突显了人工智能服务在科技行业中的重要性。微软通过OpenAI模型的大规模使用获得可观收益,但可能面临TikTok自主开发大型语言模型的挑战。

【AiBase提要:】

🔍 TikTok每月向微软支付近2000万美元,占据微软云端部门收入的四分之一。

💰 微软的云端AI业务有望实现10亿美元的年收入,受益于TikTok对OpenAI模型的使用。

⚖️ TikTok母公司字节跳动被指秘密使用OpenAI技术开发AI模型,引发违约争议和调查。

11、谷歌调整搜索以帮助隐藏明确的深度伪造内容

谷歌近日推出新的在线安全举措,旨在有效清除深度伪造内容并阻止其在搜索结果中占据显眼位置。这一举措为用户提供更安心的搜索体验。

【AiBase提要:】

😃 谷歌推出新在线安全功能,大规模删除深度伪造露骨内容。

😜 调整搜索排名,降级含虚假露骨图片的网站。

😕 持续采取措施应对网络危险和露骨内容。

12、美国版权局呼吁立法禁止AI换脸技术

美国版权局发布首份关于AI影响领域的报告,呼吁立法禁止AI换脸技术,强调未经授权的数字复制品对娱乐、政治和个人权利构成威胁。报告提出多项建议,包括责任从分发未经授权的复制品产生、保护应持续个人一生、建立安全港机制等。

【AiBase提要:】

⚖️ 需要新法律定义和打击AI驱动的换脸技术,遏制未经授权的数字复制品分发

🔒 责任应从分发或提供未经授权的数字复制品中产生,保护应至少持续个人一生

🛡️ 法规应包括安全港机制,激励在线服务商移除未经授权的数字复制品

举报

  • 相关推荐
  • AI日报:苹果AI国行或随iOS 18.6月底上线;Suno v4.5正式上线Runway发布像一致性参考功能

    本文汇总了AI领域最新动态:1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2,提升转写效率;2)Suno音乐平台v4.5版本支持8分钟歌曲生成;3)Runway推出图像一致性参考功能Gen-4 References;4)Midjourney V7新增"Omni-Reference"图像控制功能;5)Claude将引入MCP协议提升集成能力;6)iOS18.6或为中国用户启用AI功能;7)OpenAI宣布回归非营利模式;8)Freepik发布版权安全的F-Lite图像模型;9)OpenAI以30亿美

  • AI日报字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血o3

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布两款多模态推理模型o4-mini、满血版o3OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频的能力,并能调用外部工�

  • AI日报: OpenAI推出gpt-image-1像生成API;纳米AI发布MCP万能工具箱;中国占AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • AI日报Manus面向所有人开放注册;球首款设计Agent Lovart内测;教育部划清AI使用边界

    【AI日报】今日AI领域重要动态:1)国产AI平台Manus开放注册,无需邀请码即可使用;2)Lovart推出全球首款设计Agent,支持全链路自动化设计;3)教育部发布AI教育指南,禁止学生直接复制AI生成内容;4)昆仑万维开源Matrix-Game大模型,专注交互式世界生成;5)Google Gemma模型下载量突破1.5亿次;6)OpenAI新增一键导出PDF功能;7)字节跳动推出图像编辑框架DreamO;8)Kimi智能助手界面升级;9)阿里MNN更新支持通义千问2.5;10)ChatGPT新增SharePoint连接器;11)OpenVision视觉编码器发布;12)福布斯中国AI企业TOP50榜单发布;13)腾讯"元宝"工具上线,基于混元T1-Vision模型实现图片深度理解。

  • AI日报:百度大招!发布文心大模型X1TurboAI开放计划;OpenAI免费开放轻量Deep Research;即梦视频3.0内测

    【AI日报】主要报道了AI领域的最新动态:1)百度发布文心大模型X1Turbo和4.5Turbo,性能价格优势显著;2)百度推出AI开放计划,降低开发者门槛;3)OpenAI免费开放轻量版Deep Research研究工具;4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力;5)百度发布全球首个内容操作系统"沧舟OS";6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具;7)Pixverse推出MCP协议简化AI视频创作;8)Tavus发布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上线,提供免费额度;10)Adobe整合OpenAI和Google模型升级Firefly创意平台;11)ImageSlider2.0即将加入Gradio核心产品线;12)李彦宏谈DeepSeek现存痛点,强调多模态能力与降本需求。

  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • 鸿蒙5影像之王!曝华为Pura 80系列6月登场

    华为宣布将于5月19日14:30发布nova 14系列及鸿蒙电脑,其中nova 14系列是全球首款搭载鸿蒙5系统的直板机型……

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • 多模态和Agent成为大厂AI赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�