AI视野：百度推视频生成模型UniVG；下一代大模型Llama3正在训练；腾讯推视频模型VideoCrafter2；TikTok测试AI作曲功能

2024-01-19 15:30 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

1、百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

【AiBase提要:】

⭐ UniVG是一种“统一模态视频生成系统”。

⭐ 采用了“多条件交叉注意力”技术和“偏置高斯噪声”。

⭐ 在MSR-VTT视频数据库上表现出色，获得了。

项目地址:https://top.aibase.com/tool/univg

2、腾讯推视频生成模型 VideoCrafter2，克服数据限制，提高视频质量

【AiBase提要:】

👉 商业视频模型已能生成逼真视频

👉 VideoCrafter2目标是生成高质量视频

👉 VideoCrafter2提供显著的视频质量改进

项目地址:https://top.aibase.com/tool/videocrafter2

3、TikTok测试一项AI歌曲创作功能“AI Song”

【AiBase提要:】

🎵 TikTok推出AI Song，让用户通过文本提示创作歌曲

🎶 初期反馈显示生成的歌曲存在音调不准问题

🎤 YouTube也在测试音乐创作功能，提供更多创作可能

4、钉钉计划4月推出AI智能体商店

【AiBase提要:】

🎯 钉钉计划推出AI智能体商店

🎯 目标是在3年内产生1000万个AI助理，成为最活跃的AI智能体孵化、分发和交易平台

🎯预计未来将产生交易型的智能体，甚至会有很多个人来开发这类应用。

5、英伟达发布ChatQA模型性能达到GPT-4级别

【AiBase提要:】

⭐ ChatQA模型性能超越GPT-4

⭐ 使用两阶段指令调整和改进的上下文检索

⭐ 通过在多轮QA数据集上微调密集检索器，显著改善了对话式QA结果

项目地址:https://top.aibase.com/tool/aim

6、苹果发布自回归视觉模型AIM 验证性能与模型规模有关

【AiBase提要:】

👉 随着容量或预训练数据量的增加，模型性能不断提升

👉 论文证实自回归训练对于图像模型学习表征能力具有扩展性

👉 自回归目标足以满足视觉特征的训练要求，且没有饱和的迹象

📰🤖📢AI新鲜事

7、小扎正式宣战开源AGI!下一代大模型Llama3正在训练

【AiBase提要:】

🔸 下一代大模型Llama3正在训练

🔸 Meta将拥有60万个GPU等效算力

🔸35万块H100，这比GPT-4的计算能力高出约30倍

8、谷歌生成式AI搜索引擎占据84%的搜索查询

【AiBase提要:】

🔍 谷歌的Gen-AI占据84%搜索查询

🔶 搜索引擎优化格局改变，Gen-AI搜索引擎通过分析搜索的上下文、情感、意图和细微差别，提供基于事实的意见。

📈 尽管Gen-AI搜索引擎尚未全面推出，但业界已感受到变革的迫近。

9、OpenAI与亚利桑那州立大学合作，AI进入高等教育领域

【AiBase提要:】

🔹 亚利桑那州立大学计划使用OpenAI技术

🔹 合作重点:学术成功、创新研究、组织流程

🔹 拟为学生提供ChatGPT企业版使用权限

10、AI爆款设备Rabbit R1将接收Perplexity AI的实时信息

【AiBase提要:】

🔍 Rabbit在2024年CES展上宣布与Perplexity达成合作伙伴关系

🔍 该合作将将“对话式AI动力回答引擎”与Rabbit R1相连

🔍 Rabbit R1是由TeenageEngineering设计的AI设备，售价199美元

11、AI虚拟博主盘点 AI网红6周创收超1万美元

【AiBase提要:】

😍 国外创作者根据ChatGPT创建AI网红Emily 每周稳定收入1万美元

😍 测评类AI网红年收入达1700万美元

😍 时尚AI博主Lil Miquela 通过分享穿搭吸引大量品牌合作

更多AI网红致富秘诀点此查看:https://www.chinaz.com/2024/0119/1591649.shtml

12、日本文学奖得主承认借助用ChatGPT写作小说占比5%

【AiBase提要:】

1. 🏆 日本文学奖得主承认她的小说《Tokyo-to Dojo-to》约有5%是使用ChatGPT生成的。

2. 🤖 ChatGPT不仅帮助她实现潜力，还成为她的创作灵感和心灵依托，启发了小说中的对话。

3. 🤝 与一些担忧AI抄袭的艺术家不同，她看待AI为人类能力的补充，希望未来与AI保持“良好关系”并共同发展创造力。

13、Meta提出TextureDreamer:利用扩散模型生成完整的3D模型纹理贴图

【AiBase提要:】

⭐ 高质量的3D内容对AR/VR、机器人技术至关重要

⭐ TextureDreamer利用扩散模型生成完整的3D模型纹理贴图

⭐ 通过关键技术的综合应用，取得了显著改进，推动了纹理创作的民主化。

论文地址:https://arxiv.org/pdf/2401.09416.pdf

14、卡内基大学开源TOFU框架，帮助大模型遗忘隐私数据

【AiBase提要:】

🔹 TOFU框架的核心功能之一是遗忘模块

🔹 TOFU数据集帮助深入理解大模型的遗忘过程

🔹 TOFU的遗忘模块可以帮助开发者移除敏感数据

项目地址:https://top.aibase.com/tool/tofu

15、智源推Vision Mamba 高效处理视觉任务，内存能省87%

【AiBase提要:】

🔸 Vision Mamba 在图像分类、对象检测和语义分割任务上性能更高

🔸 Mamba的提出引发了对状态空间模型的兴趣

🔸 Vision Mamba块整合了双向序列建模和位置嵌入

项目地址:https://github.com/hustvl/Vim

16、新AI框架 AboutMe:用网页中自我描述来记录英语预训练数据过滤器的效果

【AiBase提要:】

🔸研究人员介绍了一个名为 AboutMe 的新数据集和框架，用于记录数据过滤对文本的影响。

🔸通过分析网页的 “关于我” 部分，研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。

🔸研究强调了预训练数据筛选过程中的复杂性，并呼吁进一步研究其社会影响。

项目网址:https://github.com/lucy3/whos_filtered

（举报）

相关推荐

关键词：

百度

百度第一！百度智能云一见领跑视觉大模型赛道

IDC最新报告显示，百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型，在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著，已服务餐饮、钢铁、电力等20多个行业，帮助数百家企业实现生产全环节的数字化管理。典型案例包括：为风电集团构建安全管控系统，巡检效率提升6-10倍；与中钢研合作金相分析模型，检测准确率达95%；助力连锁餐饮实现全国1000+门店服务质量量化管理，订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构，在保障精度的同时大幅降低应用成本，推动专业级视觉AI应用普及。

视觉大模型 IDC报告百度智能云
百度2025第二季度营收327亿元 AI新业务收入超100亿元

今日，百度正式对外发布2025年第二季度（Q2）财报，多项业务数据表现亮眼，尤其在AI新业务领域呈现出强劲的增长态势。财报显示，百度在2025年二季度总营收达到327亿元，其中百度核心营收为263亿元。值得关注的是，AI新业务收入超过100亿元，与去年同期相比增长了34%，成为推动百度营收增长的重要力量。

百度财报 AI新业务搜索业务
夸克月人均打开65次断层领先是百度的6倍以上

在QuestMobile 2025年AI应用市场半年报中，夸克的AI搜索插件以月人均64.9次的使用频次，遥遥领先其他AI搜索引擎。这一数据不仅远超同类产品，更是百度AI搜索的6倍以上，展现出断层领先的用户粘性。

AI搜索夸克搜索用户粘性
荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

《AI日报》精选AI领域最新动态：1)OpenAI发布GPT-5模型，具备强大多模态能力但推理任务仍有局限；2)知网推出AIKBase V2.0多模态数据管理系统；3)Ideogram新增"角色"功能实现图像风格统一；4)Cursor发布CLI版本支持终端AI编程；5)百度即将推出全新推理模型和文心5.0大模型；6)dots.ocr推出1.7B参数多语言文档解析工具；7)特斯拉解散Dojo超算团队转向英伟达合作；8)谷歌Pixel 10引入AI相�

GPT
百度搜索PC端全量上线AI功能

百度对外宣布其搜索PC端首页已完成全量升级，将传统信息入口一举升级为任务中枢，为用户带来前所未有的智能搜索体验，进一步巩固了其在国内AI搜索行业的领先地位。此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点，它支持用户一键进行深度搜索，无论是面对复杂的专业问题，还是多维度信息需求，都能快速给出精准且全面的解答

百度搜索 PC端升级智能搜索
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析
荐AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线AI搜索；Grok 4 AI模型永久免费开放

AI日报栏目聚焦人工智能领域最新动态：1)昆仑万维发布SkyReels-A3模型，实现语音驱动数字人生成；2)xAI宣布Grok4模型永久免费开放；3)OpenAI发布GPT-5提示词指南；4)百度PC端上线AI搜索功能；5)微软Windows Co pilot接入GPT-5；6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b；7)苹果iOS26将集成ChatGPT-5；8)谷歌推出3D视觉编辑框架BlenderFusion；9)轻量级TTS模型Kitten TTS参数仅1500万；10)MiniCPM-V

AI技术数字人创作语音驱动
百利好：清晰视界守护光明

文章聚焦全球儿童视力健康问题，指出目前全球约140万儿童失明、700万视力低下，中国视力障碍儿童占比1.56%。视力问题严重影响儿童身心发展，给家庭和社会带来沉重负担。百利好慈善基金会与奥比斯合作推出为期三年的"中国儿童综合眼部健康计划"，重点包括：加强县级儿童眼科服务，优化眼健康转诊网络，推广全面眼保健。计划将通过设备支持、技术培训、健康教育等方式，提升基层医疗能力，重点关注农村地区儿童视力健康。自1982年以来，奥比斯已帮助数万名患者恢复视力。该计划旨在实现"让每个孩子看清世界"的愿景，需要社会各界共同关注与支持。

儿童视力健康眼科公益视力障碍
实力见证！安得智联三度蝉联中物联科技进步一等奖

8月20日，第十八届现代物流科技创新大会在包头召开，聚焦数智供应链、AI+物流、绿色低碳等前沿领域。安得智联凭借"数智赋能全球智能绿色生产物流全链路创新与应用"项目，连续三年蝉联中国物流与采购联合会科技进步一等奖。该项目通过构建智能物流、绿色物流、全球化网络三大体系，为制造业供应链数字化转型提供标杆方案，助力中国制造在全球价值链中持续攀升。

物流科技创新数智供应链 AI+物流
赵露思直播意外带火面馆：销量激增至几百份食材一度卖空

8 月 5 日消息，近日，演员赵露思的一场直播意外引发了连锁效应，不仅让成都一家原本默默无闻的面馆成为网红打卡地，更带动了相关商品的热销。据媒体报道，有眼尖的网友发现赵露思直播的地点是在成都的一家特色面馆，消息一出，不少博主纷纷前往该面馆探店，并拍摄短视频分享至网络，冠以“露思同款”标签，迅速吸引了大量粉丝和食客的关注。面馆负责人透露�

赵露思成都面馆网红打卡

今日大家都在搜的词：

热文

3 天
7天

AI视野：百度推视频生成模型UniVG；下一代大模型Llama3正在训练；腾讯推视频模型VideoCrafter2；TikTok测试AI作曲功能

百度第一！百度智能云一见领跑视觉大模型赛道

百度2025第二季度营收327亿元 AI新业务收入超100亿元

夸克月人均打开65次断层领先是百度的6倍以上

荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

百度搜索PC端全量上线AI功能

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

荐AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线AI搜索；Grok 4 AI模型永久免费开放

百利好：清晰视界守护光明

实力见证！安得智联三度蝉联中物联科技进步一等奖

赵露思直播意外带火面馆：销量激增至几百份食材一度卖空

今日大家都在搜的词：

热文

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

黑神话官号更名系列游戏将开启宏大篇章

泡泡玛特王宁：本周将发布迷你版LABUBU

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

REDMI Note 15 Pro+将首发第四代骁龙7s

曝iPhone18放弃相机按钮因用户使用频率不高

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

转战播客赛道！罗永浩微博改名“罗永浩的十字路口”

站长商机