首页 > 原创 > 关键词  > Claude最新资讯  > 正文

AI日报:Claude推出桌面客户端;ChatGPT、谷歌Gemini均推搜索功能;阿里EcomID原生支持ComfyUI;Suno新增AI歌手克隆功能

2024-11-01 15:50 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Anthropic旗下Claude AI推出桌面客户端

Anthropic公司推出了AI聊天机器人Claude的桌面应用程序,提升用户体验,使用户能更便捷地与Claude互动。同时,移动端应用也新增了语音输入功能,增强用户交互体验。

image.png

【AiBase提要:】

🚀 提升用户体验,推出桌面应用程序,方便用户与Claude互动。

🎤 移动端应用新增语音输入功能,用户可以通过语音与Claude交流。

💻 竞争对手如ChatGPT和Perplexity已推出桌面应用,Anthropic公司保持竞争力。

详情链接:https://claude.ai/download

2、OpenAI公司推出ChatGPT search搜索功能

OpenAI公司推出了名为ChatGPT search的新功能,用户可以通过对话界面快速获取最新的网络搜索结果,无需跳转到传统搜索引擎,提供实时信息如体育比分、新闻、股票报价等。该功能简化了用户获取有用答案的过程,使用户可以以自然、对话的方式提问,并获得更好的答案。

【AiBase提要:】

🔍 ChatGPT search功能让用户通过对话界面快速获取最新网络搜索结果,提供实时信息如体育比分、新闻、股票报价等。

🔄 用户可以选择让ChatGPT搜索网络或手动点击搜索图标进行搜索,使获取信息更便捷。

🌐 OpenAI与新闻和数据提供商合作,为搜索结果添加最新信息和新的视觉设计,强调归因可信新闻源的信息,扩大出版商的影响力。

3、谷歌 Gemini API 推出 “连接实时搜索” 功能 提升AI响应准确性

谷歌 AI 工作室与 Gemini API联合推出了“与谷歌搜索的实时连接”功能,旨在帮助开发者提升AI模型的响应准确性。这一功能能从谷歌搜索中获取最新信息,减少虚假信息,提供透明且最新的回答。同时支持动态检索,开发者可根据需要灵活激活实时数据检索,提高回答质量。

image.png

【AiBase提要:】

🌐 新功能 “与谷歌搜索的实时连接” 旨在提高AI模型的响应准确性。

💰 Gemini API定价为每1000个查询35美元,支持实时数据检索。

🔄 开发者可根据需求灵活激活实时数据检索,提高回答质量。

4、带图层的AI生图软件来了!Blendbox Alpha 版发布

Blendbox Alpha版是一款革命性的AI图像生成软件,重新定义了艺术家创作的方式。通过引入图层概念,用户可以像使用PS一样控制图像生成,摆脱了过度依赖提示词的创作方式。艺术家可以实时调整纹理、光影、颜色方案和对象位置,实现高度的创作自由。

【AiBase提要:】

🎨 Blendbox Alpha版重新定义了AI艺术创作方式,让艺术家重新掌控创作过程。

🔧 Blendbox通过模块化的图像控制功能,允许用户调整单个元素,加快创作迭代速度。

🖼 Blendbox的图像更改是局部进行的,艺术家可以针对特定区域和元素进行调整,保持图像整体性。

详情链接:https://www.blendbox.ai/

5、告别“假脸”模特!阿里EcomID重磅来袭

阿里巴巴最新发布的AI人像生成项目EcomID带来了显著突破,完美继承了InstantID和PulID的优势,实现了创新。该工具在图像生成效果、文本到图像功能、用户体验等方面都有突出表现,重新定义了AI图像生成的品质标准。

image.png

【AiBase提要:】

🚀 EcomID在技术层面采用创新的架构设计,借鉴了PuLID的ID-Encoder和交叉注意力组件,降低了ID embedding对文本embedding的干扰。

💡 EcomID的亮点在于卓越的图像生成效果,保持稳定的身份特征,完整保留了文本到图像的功能,极大提升了生成图像的真实感。

⚙️ SDXL-EcomID为ComfyUI用户带来全新使用体验,支持基础和换脸两种工作流程,提供高级定制功能,展现出极强的适应性。

详情链接:https://github.com/alimama-creative/SDXL_EcomID_ComfyUI

6、D-ID推超逼真AI虚拟头像:进行视频训练就能复刻头部和躯干动作

D-ID推出两款新型虚拟头像Express和Premium+,旨在提升内容创作的质量和效率,满足企业在市场营销、销售和客户支持等领域的需求。公司致力于打造超逼真的虚拟头像,提供实时互动能力,以增强用户体验。个性化视频活动显著提升企业点击率和转化率。

image.png

【AiBase提要:】

🌟 D-ID推出Express和Premium+两款新型虚拟头像,提升内容创作效率。

🤖 Premium+头像具备实时互动能力,适合网络研讨会和翻译应用。

📈 个性化视频活动显著提升企业的点击率和转化率。

7、Suno新增AI歌手克隆功能,一键复刻专属音乐风格

Suno推出的Personas功能让用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的AI音乐,打造专属音乐IP。这项突破性功能允许用户提取保存某首歌曲的核心元素,包括人声特点、音乐风格和情感氛围,让创作保持一致的个人特色。

【AiBase提要:】

⚙️ 用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的AI音乐,打造专属音乐IP。

🎵 Personas功能允许用户提取保存某首歌曲的核心元素,包括人声特点、音乐风格和情感氛围,让创作保持一致的个人特色。

🔗 用户可以选择将自己的Persona设为公开或私密,拥有独立页面,展示在创作者的资料库和个人主页中,增加音乐创作的社交价值。

详情链接:https://top.aibase.com/tool/suno-ai

8、ElevenLabs推开源小项目X-to-Voice:一键将Twitter账号转化为个性化虚拟形象

ElevenLabs最近发布了开源项目X-to-Voice,利用声音设计API和动态头像技术,智能分析Twitter用户资料,生成个性化虚拟形象。项目高度个性化定制,用户只需输入账号名称即可获得独特声音配置和动画头像。技术整合了声音生成、动态头像制作等多项尖端技术,提供全新社交表达方式。

image.png

【AiBase提要:】

🔊 个性化声音生成和动态头像制作

🤖 技术整合包括声音设计API和Taedra工具

🌐 项目部署在Vercel平台,提供简单用户体验

详情链接:https://github.com/elevenlabs/elevenlabs-examples/tree/main/examples/text-to-voice/x-to-voice

9、Meta 重磅发布!MobileLLM 模型全面开放,研究人员免费获取!

Meta 最近宣布其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这一举措推动移动设备上的大型语言模型研究和开发,为开发者和学术界提供更广泛的工具与资源。

image.png

【AiBase提要:】

🌟 Meta 的 MobileLLM 模型现已在 Hugging Face 平台上免费提供,供研究人员下载与测试。

🤖 MobileLLM 旨在推动移动设备上的大型语言模型研究,降低使用门槛。

📈 企业与开发者被鼓励通过 AI 技术优化流程,以实现更好的业务绩效。

详情链接:https://huggingface.co/collections/facebook/mobilellm-6722be18cb86c20ebe113e95

10、夸克发布“灵知”学习大模型 全面升级“AI搜题”让新题、难题都有解

夸克全面升级“AI搜题”产品,提升搜题与解题速度与能力,助力用户提升学习效率。夸克AI能力落地于学习场景,让学习更智能。夸克“灵知”学习大模型实力强劲,解决用户痛点,产品能力得到全新发展。

image.png

【AiBase提要:】

🚀 夸克全面升级“AI搜题”产品,加速学习产品创新,提升用户学习效率。

💡 夸克“AI搜题”是全网首家完成全面AI化升级的搜题产品,支持各类题目搜寻与专业内容解答。

🧠 夸克“灵知”学习大模型在性能评测中表现优异,具备领先的推理能力和知识正确性。

11、字节祭出开源秘密武器HybridFlow,大模型训练速度飙升20倍,成本砍到脚脖子!

大模型(LLM)如GPT、Llama等在人工智能领域掀起了革命,但高效训练符合人类价值观仍是难题。字节跳动豆包团队开源HybridFlow框架,为RLHF带来新可能性。HybridFlow结合单控制器和多控制器模式,灵活高效执行RLHF数据流,吞吐量提升20.57倍,推动LLM技术发展。

image.png

【AiBase提要:】

🚀 HybridFlow框架创新结合单多控制器模式,解耦复杂计算数据依赖,灵活高效执行RLHF数据流。

💡 HybridFlow支持多种RLHF算法,如PPO、ReMax、Safe-RLHF,提供模块化API,简化算法实现和扩展。

⚙️ HybridFlow的3D-HybridEngine组件支持高效模型权重重组,减少内存冗余和通信开销,提升训练效率。

详情链接:https://arxiv.org/pdf/2409.19256

12、谷歌地图终于开挂!Gemini加持解锁多项神技,网友:这才是真正的智能导航

谷歌地图近日宣布通过Gemini生成式AI模型进行重大升级,提供智能导航和全新场所发现体验,展示技术实力和用户体验持续努力。

image.png

【AiBase提要:】

🌟 谷歌地图整合Gemini AI模型,提供智能推荐功能,用户可用自然语言询问建议,系统智能筛选符合需求的场所。

🚗 导航体验全面优化,显示车道、人行横道和路标信息,提供准确车道选择建议,支持街景和AR实景导航模式。

🌍 新功能包括天气干扰报告、沉浸式视图扩展至全球150个城市,Waze导航应用也接入Gemini AI,提升用户体验。

举报

  • 相关推荐
  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 腾讯悄悄上线了“Claude Code”,居然还支持微信登录。

    ​昨晚,腾讯发了他们的CodeBuddy Code,正式也加入命令行编程Agent战场。 说实话,CodeBuddy这产品,真的有点玄学在身上的。 我之前就当个新闻写,写了两次,一次插件,一次IDE,两次都快10w+,尼玛。。。

  • Claude 用不了?蓝耘 Coding Agent 提供原生替代方案,更轻量、高性价比的替代选择

    Anthropic宣布停止向中国资本控股企业提供Claude服务,蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本,提供可视化控制台和本地化服务,助力开发者无缝衔接开发流程,确保工作连续性。

  • 构建全场景数字生态:三星商显产品亮相AUTODESK论坛与全球数贸会

    三星近日在上海欧特克论坛及全球数字贸易博览会两大行业展会展示多款商用显示产品。通过汽车设计、智慧会议等高端应用场景的创新矩阵,全面展现其在商用显示领域的前瞻布局与技术底蕴。明星产品The Wall IWB与IAB系列以超高清晰度、精准色彩及高效协同能力吸引专业观众,推动汽车设计乃至高端制造业研发模式变革。同时亮相的智能数字标牌、电子白板及彩色电子纸等产品,覆盖多场景技术路线,彰显三星作为行业引领者通过显示技术赋能各行业数字化转型升级的战略布局。

  • 绿舟带你看EUDR申报示例!了解EUDR违规有何风险

    欧盟《毁林条例》(EUDR)将于2025年12月30日起对大企业生效,2026年6月30日起对中小企业生效。该法规要求销往欧盟市场的相关商品(如大豆、木材、咖啡等)需证明供应链不涉及毁林,企业须履行尽职调查义务,包括信息收集、风险评估和合规声明。违规可能面临产品下架、高额罚款甚至市场禁入。FSC认证虽不能直接替代EUDR合规,但可作为风险缓释工具。文章建议卖家提前布局,通过确认产品类别、收集供应链数据、引入第三方认证等方式主动应对,以把握可持续贸易机遇。

  • 音质升级 焕新登场 三星Galaxy Buds3 FE正式上市

    三星Galaxy智能新品于9月19日正式开售,包括Tab S11 Ultra、Tab S11、Tab S10 Lite平板及Buds3 FE耳机。新品搭载AI功能,支持多设备互联,提供大屏交互、专业音频体验。Tab S11 Ultra起售价8999元,Tab S11起售5999元,Tab S10 Lite起售2599元,Buds3 FE售价949元。即日起消费者可通过线上线下渠道购买,享受购机好礼。

  • 同传翻译 流畅交流 三星Galaxy Buds3 FE出境游必备

    十一假期临近,三星Galaxy Tab S11系列平板与Galaxy Buds3FE等智能新品成为旅行好帮手。Tab S11通过大屏与AI功能简化行程规划、购票等准备工作,支持智能拖拽分屏提升效率;Buds3FE则提供实时翻译功能,解决出境游语言障碍。两者结合让旅行更轻松,回归纯粹享受。

  • 阿里 Qoder 限时五折启动,支持支付宝,性价比远超Cursor

    阿里巴巴旗下新一代AI编程平台Qoder近期推出限时5折优惠活动,支持支付宝付款,旨在吸引更多开发者体验其高效编程能力。Qoder集成全球顶级编程模型,具备强大的代码处理功能,可一次性检测10万个代码文件,并首发Repo Wiki功能,自动生成结构化项目文档。平台检索召回率和代码生成准确率分别领先行业标杆12%和13%,显著提升复杂工程的理解与生成效率。实测显示,利用Qoder开发电商全栈应用可将数天工作量压缩至十分钟内完成。目前已有数十万开发者深度使用,团队重视用户反馈并持续升级核心功能,如新增“远程委派”和“上下文压缩”功能,优化开发体验。此次活动诚意邀请全球开发者感受AI编程的技术革新。

  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • 华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低

    华为在2025全联接大会上发布CloudRobo具身智能平台,通过云端赋能打破机器人硬件限制,实现轻量化、智能化和场景泛化。该平台整合数据生产、训练及运行管理,支持多领域落地应用,并联合行业伙伴共建R2C协议,推动具身智能产业规模化发展。

今日大家都在搜的词: