首页 > 业界 > 关键词  > 百度最新资讯  > 正文

AI视野:百度推视频生成模型UniVG;下一代大模型Llama3正在训练;腾讯推视频模型VideoCrafter2;TikTok测试AI作曲功能

2024-01-19 15:30 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

1、百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

image.png

【AiBase提要:】

⭐ UniVG是一种“统一模态视频生成系统”。

⭐ 采用了“多条件交叉注意力”技术和“偏置高斯噪声”。

⭐ 在MSR-VTT视频数据库上表现出色,获得了。

项目地址:https://top.aibase.com/tool/univg

2、腾讯推视频生成模型 VideoCrafter2,克服数据限制,提高视频质量

image.png

【AiBase提要:】

👉 商业视频模型已能生成逼真视频

👉 VideoCrafter2目标是生成高质量视频

👉 VideoCrafter2提供显著的视频质量改进

项目地址:https://top.aibase.com/tool/videocrafter2

3、TikTok测试一项AI歌曲创作功能“AI Song”

【AiBase提要:】

🎵 TikTok推出AI Song,让用户通过文本提示创作歌曲

🎶 初期反馈显示生成的歌曲存在音调不准问题

🎤 YouTube也在测试音乐创作功能,提供更多创作可能

4、钉钉计划4月推出AI智能体商店

【AiBase提要:】

🎯 钉钉计划推出AI智能体商店

🎯 目标是在3年内产生1000万个AI助理,成为最活跃的AI智能体孵化、分发和交易平台

🎯预计未来将产生交易型的智能体,甚至会有很多个人来开发这类应用。

5、英伟达发布ChatQA模型 性能达到GPT-4级别

【AiBase提要:】

⭐ ChatQA模型性能超越GPT-4

⭐ 使用两阶段指令调整和改进的上下文检索

⭐ 通过在多轮QA数据集上微调密集检索器,显著改善了对话式QA结果

项目地址:https://top.aibase.com/tool/aim

6、苹果发布自回归视觉模型AIM 验证性能与模型规模有关

image.png

【AiBase提要:】

👉 随着容量或预训练数据量的增加,模型性能不断提升

👉 论文证实自回归训练对于图像模型学习表征能力具有扩展性

👉 自回归目标足以满足视觉特征的训练要求,且没有饱和的迹象

📰🤖📢AI新鲜事

7、小扎正式宣战开源AGI!下一代大模型Llama3正在训练

image.png

【AiBase提要:】

🔸 下一代大模型Llama3正在训练

🔸 Meta将拥有60万个GPU等效算力

🔸35万块H100,这比GPT-4的计算能力高出约30倍

8、谷歌生成式AI搜索引擎占据84%的搜索查询

【AiBase提要:】

🔍 谷歌的Gen-AI占据84%搜索查询

🔶 搜索引擎优化格局改变,Gen-AI搜索引擎通过分析搜索的上下文、情感、意图和细微差别,提供基于事实的意见。

📈 尽管Gen-AI搜索引擎尚未全面推出,但业界已感受到变革的迫近。

9、OpenAI与亚利桑那州立大学合作,AI进入高等教育领域

【AiBase提要:】

🔹 亚利桑那州立大学计划使用OpenAI技术

🔹 合作重点:学术成功、创新研究、组织流程

🔹 拟为学生提供ChatGPT企业版使用权限

10、AI爆款设备Rabbit R1将接收Perplexity AI的实时信息

【AiBase提要:】

🔍 Rabbit在2024年CES展上宣布与Perplexity达成合作伙伴关系

🔍 该合作将将“对话式AI动力回答引擎”与Rabbit R1相连

🔍 Rabbit R1是由TeenageEngineering设计的AI设备,售价199美元

11、AI虚拟博主盘点 AI网红6周创收超1万美元

【AiBase提要:】

😍 国外创作者根据ChatGPT创建AI网红Emily 每周稳定收入1万美元

😍 测评类AI网红年收入达1700万美元

😍 时尚AI博主Lil Miquela 通过分享穿搭吸引大量品牌合作

更多AI网红致富秘诀点此查看:https://www.chinaz.com/2024/0119/1591649.shtml

12、日本文学奖得主承认借助用ChatGPT写作小说 占比5%

【AiBase提要:】

1. 🏆 日本文学奖得主承认她的小说《Tokyo-to Dojo-to》约有5%是使用ChatGPT生成的。

2. 🤖 ChatGPT不仅帮助她实现潜力,还成为她的创作灵感和心灵依托,启发了小说中的对话。

3. 🤝 与一些担忧AI抄袭的艺术家不同,她看待AI为人类能力的补充,希望未来与AI保持“良好关系”并共同发展创造力。

13、Meta提出TextureDreamer:利用扩散模型生成完整的3D模型纹理贴图

image.png

【AiBase提要:】

⭐ 高质量的3D内容对AR/VR、机器人技术至关重要

⭐ TextureDreamer利用扩散模型生成完整的3D模型纹理贴图

⭐ 通过关键技术的综合应用,取得了显著改进,推动了纹理创作的民主化。

论文地址:https://arxiv.org/pdf/2401.09416.pdf

14、卡内基大学开源TOFU框架,帮助大模型遗忘隐私数据

【AiBase提要:】

🔹 TOFU框架的核心功能之一是遗忘模块

🔹 TOFU数据集帮助深入理解大模型的遗忘过程

🔹 TOFU的遗忘模块可以帮助开发者移除敏感数据

项目地址:https://top.aibase.com/tool/tofu

15、智源推Vision Mamba 高效处理视觉任务,内存能省87%

【AiBase提要:】

🔸 Vision Mamba 在图像分类、对象检测和语义分割任务上性能更高

🔸 Mamba的提出引发了对状态空间模型的兴趣

🔸 Vision Mamba块整合了双向序列建模和位置嵌入

项目地址:https://github.com/hustvl/Vim

16、新AI框架 AboutMe:用网页中自我描述来记录英语预训练数据过滤器的效果

【AiBase提要:】

🔸研究人员介绍了一个名为 AboutMe 的新数据集和框架,用于记录数据过滤对文本的影响。

🔸通过分析网页的 “关于我” 部分,研究团队测量了网站作者的兴趣、社会角色和地理位置等信息。

🔸研究强调了预训练数据筛选过程中的复杂性,并呼吁进一步研究其社会影响。

项目网址:https://github.com/lucy3/whos_filtered

举报

  • 相关推荐
  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 百度2025第二季度营收327亿元 AI新业务收入超100亿元

    今日,百度正式对外发布2025年第二季度(Q2)财报,多项业务数据表现亮眼,尤其在AI新业务领域呈现出强劲的增长态势。 财报显示,百度在2025年二季度总营收达到327亿元,其中百度核心营收为263亿元。值得关注的是,AI新业务收入超过100亿元,与去年同期相比增长了34%,成为推动百度营收增长的重要力量。

  • 夸克月人均打开65次 断层领先 是百度的6倍以上

    在QuestMobile 2025年AI应用市场半年报中,夸克的AI搜索插件以月人均64.9次的使用频次,遥遥领先其他AI搜索引擎。 这一数据不仅远超同类产品,更是百度AI搜索的6倍以上,展现出断层领先的用户粘性。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • 百利好:清晰视界 守护光明

    文章聚焦全球儿童视力健康问题,指出目前全球约140万儿童失明、700万视力低下,中国视力障碍儿童占比1.56%。视力问题严重影响儿童身心发展,给家庭和社会带来沉重负担。百利好慈善基金会与奥比斯合作推出为期三年的"中国儿童综合眼部健康计划",重点包括:加强县级儿童眼科服务,优化眼健康转诊网络,推广全面眼保健。计划将通过设备支持、技术培训、健康教育等方式,提升基层医疗能力,重点关注农村地区儿童视力健康。自1982年以来,奥比斯已帮助数万名患者恢复视力。该计划旨在实现"让每个孩子看清世界"的愿景,需要社会各界共同关注与支持。

  • 实力见证!安得智联三度蝉联中物联科技进步一等奖

    8月20日,第十八届现代物流科技创新大会在包头召开,聚焦数智供应链、AI+物流、绿色低碳等前沿领域。安得智联凭借"数智赋能全球智能绿色生产物流全链路创新与应用"项目,连续三年蝉联中国物流与采购联合会科技进步一等奖。该项目通过构建智能物流、绿色物流、全球化网络三大体系,为制造业供应链数字化转型提供标杆方案,助力中国制造在全球价值链中持续攀升。

  • 赵露思直播意外带火面馆:销量激增至几百份 食材一度卖空

    ​8 月 5 日消息,近日,演员赵露思的一场直播意外引发了连锁效应,不仅让成都一家原本默默无闻的面馆成为网红打卡地,更带动了相关商品的热销。据媒体报道,有眼尖的网友发现赵露思直播的地点是在成都的一家特色面馆,消息一出,不少博主纷纷前往该面馆探店,并拍摄短视频分享至网络,冠以“露思同款”标签,迅速吸引了大量粉丝和食客的关注。 面馆负责人透露�

今日大家都在搜的词: