首页 > 业界 > 关键词  > SearchGPT最新资讯  > 正文

AI日报:OpenAI推搜索引擎SearchGPT;智谱推AI视频产品清影;字节发布豆包图生图模型;B站上线AIGC推荐广告标题功能

2024-07-26 15:13 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、挑战谷歌!OpenAI推搜索引擎SearchGPT初期仅邀请1万人测试

OpenAI推出SearchGPT,一个由人工智能驱动的搜索引擎,与传统搜索引擎不同,它整理和总结搜索结果。目前处于原型阶段,由GPT-4支持,向1万测试用户开放。OpenAI与第三方合作构建搜索结果,计划将搜索功能集成到ChatGPT中。

【AiBase提要:】

🔍 SearchGPT是由人工智能驱动的搜索引擎,整理和总结搜索结果。

🚀 目前处于原型阶段,由GPT-4支持,向1万测试用户开放。

💡 OpenAI计划将搜索功能直接集成到ChatGPT中,与Google竞争,注重内容使用合作与信息归属清晰性。

详情链接:https://chatgpt.com/search

2、智谱AI推出AI生成视频产品清影

智谱AI推出了名为清影(Ying)的AI大模型,能够将任意文字生成视频,用户只需输入一段文字和选择风格即可生成高精度视频。清影已上线清言App,支持文本生成视频和图片生成视频,同时推出“照片动起来”小程序。CEO张鹏提到清影底座的视频生成模型CogVideoX融合了文本、时间和空间三个维度,提升了推理速度。用户可以通过智谱清言PC/APP体验清影,将灵感转化为艺术视频创作。

image.png

【AiBase提要:】

🎥 清影是智谱AI推出的AI大模型,能够生成高精度视频,支持文本生成视频和图片生成视频。

💡 清影基于新型DiT模型架构,融合文本和视频内容,提升了指令遵从能力和内容连贯性。

🚀 CogVideoX是清影底座的视频生成模型,融合了文本、时间和空间三个维度,提升了推理速度,未来将推出更高分辨率、更长时长的生成视频功能。

详情链接:https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu

3、字节跳动发布豆包·图生图模型 豆包大模型日均tokens使用量超5000亿

火山引擎在成都举办了2024AI 创新巡展,宣布豆包大模型日均tokens使用量超过5000亿,客户日均使用量增长22倍。张鑫副总裁表示火山引擎正向智能化、行业化和区域化方向发展,助力企业实现业务创新。发布豆包大模型的最新能力包括视觉图像、语音合成、声音复刻等升级。

【AiBase提要:】

🚀 豆包大模型日均tokens使用量超5000亿,客户日均使用量增长22倍。

🔍 豆包·图生图模型和豆包·文生图模型在保留原图特征和提升画面质感方面表现突出。

🔊 豆包·语音合成模型和豆包·声音复刻模型在表达情绪和还原说话人声音特征方面有所提升。

4、AI视频生成器Runway被曝使用盗版YouTube内容进行训练

这篇文章揭露了Runway公司开发的Gen-3Alpha视频生成器使用盗版内容的丑闻,引发了版权争议。AI公司频频触犯版权法,立法者也在重新审视版权法规以适应新的技术挑战。

【AiBase提要:】

📊 Runway视频生成器被曝使用盗版内容—引发版权争议

🛡️ AI公司频频触犯版权法—版权纠纷成为AI发展的瓶颈

📜 立法者重新审视版权法规—法律和版权使用政策不断更新

5、告别标题难民!B站上线AIGC推荐广告标题功能

在这个创意为王的时代,B站推出的AIGC推荐广告标题功能为广告创作注入了新的活力。通过AI生成的10个爆款标题,让创作过程更简单高效,为广告效果提升增添了可能。

【AiBase提要:】

🔑 创意为王,标题是关键。AIGC推荐广告标题功能让创作更简单高效。

🤖 AI大师背后,基于海量数据训练。生成风格各异、抓人眼球的标题。

🚀 持续优化AI大师,让标题更精准、更有针对性。广告创作自由度得到大胆拓展。

6、即刻AI搜索神器问问小宇宙来了

即刻App推出了基于小宇宙的AI搜索功能——问问小宇宙,专注于声音内容的深度挖掘,提供深度讨论和独到见解。界面复古的配色和个性化推荐功能是其特色,让搜索结果更加丰富、多元,贴近用户需求。

image.png

【AiBase提要:】

🔍 问问小宇宙是基于小宇宙的AI搜索功能,专注声音内容挖掘。

🎧 提供深度讨论和独到见解,推荐相关音频内容。

🎨 界面复古配色,个性化推荐功能,丰富、多元的搜索结果,贴近用户需求。

详情链接:https://top.aibase.com/tool/wenwenxiaoyuzhou

7、翻译界的“AI特工”!字节跳动推端到端语音同步翻译系统CLASI

CLASI是字节跳动推出的端到端语音同步翻译系统,为全球交流带来革新。它结合语言模型和信息检索系统,实现准确快速的翻译,具备上下文记忆功能,超越人类译员。虽然不完美,但通过机智的应对能力,提供高效的翻译服务。CLASI的出现开辟了跨语言交流新天地,为人类沟通方式带来温和革新。

【AiBase提要:】

🌐 CLASI是端到端语音同步翻译系统,结合语言模型和信息检索系统,实现准确快速翻译。

🧠 CLASI具备上下文记忆功能,能联系之前内容确保翻译连贯性,超越人类译员。

🔍 CLASI通过机智的应对能力,猜测意思并提供合理翻译,在传达有效信息能力上胜过商业和开源系统。

详情链接:https://top.aibase.com/tool/clasi

8、武汉大学联合中国移动九天人工智能团队开源音视频说话人识别数据集 VoxBlink2

武汉大学联合中国移动九天人工智能团队和昆山杜克大学基于YouTube数据开源了超过11万小时的音视频说话人识别数据集VoxBlink2,是目前最大的公开可用的音视频说话人识别数据集。该数据集丰富了开源语音语料库,支持训练声纹大模型。

image.png

【AiBase提要:】

🔍 数据集规模超过11万小时,包含9904382个高质量音频片段及视频片段,来自YouTube上的111284名用户。

🔬 数据集经过多步骤的数据挖掘,包括候选人准备、人脸提取&检测、人脸识别、活动说话人检测等,准确率提升至92%。

🛠 VoxBlink2开源了不同大小的声纹模型,包括基于ResNet的2D卷积模型和基于ECAPA-TDNN的时序模型,以及超大模型ResNet293,在Vox1-O数据集上表现出色。

详情链接:https://VoxBlink2.github.io

9、谷歌Gemini重大更新:多语言支持、性能提升、面向青少年开放

谷歌宣布对其AI聊天机器人Gemini进行全面升级,包括多语言支持、性能提升和面向青少年开放。这次更新将提升用户体验,降低运营成本,增加透明度,拓展应用场景,展现谷歌在AI领域的雄心和决心。

【AiBase提要:】

🌐 多语言支持: Gemini1.5Flash支持40种语言,覆盖230个国家和地区,提升质量和响应速度。

🔍 上下文窗口扩展: Gemini上下文窗口扩展到32,000个标记,支持更长文本处理和文件上传功能。

🚀 更广泛的应用场景: Gemini功能将扩展到Messages应用集成、手机应用推广和面向青少年开放。

10、轻松调优!微软针对Phi-3小型语言模型推出无服务器微调功能

微软推出针对Phi-3小型语言模型的无服务器微调功能,为开发者提供了轻松调整和优化模型性能的便利。这一举措将进一步推动AI应用的发展和普及。

image.png

【AiBase提要:】

📈 无服务器微调功能:开发者可以在无需管理服务器的情况下,轻松调整Phi-3模型,提高性能表现。

💰 高性价比的Phi-3模型:以低成本提供高效性能,适用于各种企业应用场景。

🤖 市场竞争激烈:微软与OpenAI等AI提供商之间的竞争加剧,推动了AI行业的发展。

详情链接:https://azure.microsoft.com/en-us/blog/announcing-phi-3-fine-tuning-new-generative-ai-models-and-other-azure-ai-updates-to-empower-organizations-to-customize-and-scale-ai-applications/

11、马斯克寻求特斯拉董事会批准向 xAI 注资50亿美元

马斯克计划向人工智能初创公司 xAI 投资50亿美元,可能引发科技公司网络利益冲突。特斯拉转型为机器人和人工智能公司,马斯克承诺建立自主机器人出租车和人形机器人车队。 xAI 成立于去年7月,估值180亿美元,马斯克追赶竞争对手OpenAI和Anthropic。

【AiBase提要:】

🚀 马斯克计划向 xAI 投资50亿美元,可能引发科技公司网络利益冲突。

🤖 特斯拉转型为机器人和人工智能公司,马斯克承诺建立自主机器人出租车和人形机器人车队。

💰 xAI 成立于去年7月,估值180亿美元,马斯克追赶竞争对手OpenAI和Anthropic。

12、谷歌AI几何超进化:IMO金牌之争,19秒解题速度碾压人类选手

本文介绍了谷歌DeepMind的AI系统在国际数学奥林匹克竞赛(IMO)上的惊人表现,以一分之差惜败夺得银牌。AI展现出超凡的解题能力和速度,碾压人类选手,引发人们对AI在数学领域的无限可能性的思考。

【AiBase提要:】

🏅 AI系统在IMO竞赛中以惊人表现夺得银牌,展现出超凡的解题能力和速度。

🧠 AlphaProof和AlphaGeometry2两款AI系统擅长数学推理和几何解题,在未来发展中具有巨大潜力。

🌐 谷歌AI在数学领域的超进化挑战人类智能,为人工通用智能(AGI)的发展提供新方向。

详情点此查看:https://www.chinaz.com/ainews/10608.shtml

13、Anthropic的爬虫机器人无视网站反AI抓取政策遭吐槽

Anthropic公司的爬虫机器人ClaudeBot在24小时内频繁访问多个网站,引发了网站所有者和创始人的不满。这种行为不仅违反了使用条款,还占用了网站的开发资源,导致多个网站遭受爬虫侵扰。

【AiBase提要:】

🤖 爬虫频繁访问iFixit、Read the Docs等网站,违反使用条款和占用开发资源。

🔒 iFixit已添加crawl-delay扩展限制爬虫访问,其他网站也遭到侵扰。

🚫 许多AI公司通过robots.txt拒绝爬虫访问,但存在忽略规则和保护数据的争议。

举报

  • 相关推荐
  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。