首页 > 业界 > 关键词  > 文心一言最新资讯  > 正文

AI日报:百度重磅发布智能“新搜索”;Luma新增镜头运动控制功能;ComfyUI图片转视频支持编辑表情;xAI上线全球AI训练系统Colossus

2024-09-04 14:56 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、百度文心一言App全新升级为“文小言”:9月文心大模型4.0免费用

百度宣布旗下人工智能应用“文心一言”App进行了重大更新,推出全新的4.0.0版本,正式更名为“文小言”。新版本功能得到显著增强,提供更丰富的使用场景。用户可享受搜索、创作、聊天等多种AI能力。特别升级版本新增五大核心场景能力,包括提问、陪聊、撰写文章、绘制图片和分配任务。百度将免费开放文心4.0大模型使用,提供会员服务优惠。

微信截图_20240904081429.png

【AiBase提要:】

🚀 文小言App功能得到显著增强,提供更丰富的使用场景。

💡 新版本新增五大核心场景能力,包括提问、陪聊、撰写文章、绘制图片和分配任务。

🎁 百度将免费开放文心4.0大模型使用,提供会员服务优惠。

2、Luma发布Dream Machine1.6:新增镜头运动控制功能 让视频生成更有 “电影感”!

Luma AI最新发布的Dream Machine1.6版本为AI视频生成技术带来了惊喜,新增了12种不同的摄像机动作控制功能,大幅提升了创作工具的控制能力。用户反馈积极,认为新功能节省了时间,增强了摄像机动作的幅度和动态效果。新版本提供更高质量、更逼真的文本到视频生成体验,是值得关注的选择。

【AiBase提要:】

⚙️ 新增12种不同的摄像机动作控制功能,提升创作工具的控制能力。

🔍 用户反馈积极,认为新功能节省时间,增强摄像机动作的幅度和动态效果。

🚀 新版本提供更高质量、更逼真的文本到视频生成体验,为视频内容生产带来革命性变革。

详情链接:https://top.aibase.com/tool/luma-ai

3、马斯克的xAI上线全球最强AI训练系统Colossus

马斯克的xAI公司推出了名为“Colossus”的AI训练系统,配备100,000块Nvidia H100GPU,被称为全球最强AI训练系统。这标志着xAI在AI领域取得重要进展,将为旗舰产品Grok-2的继任者提供强大计算支持。马斯克计划在未来几个月将Colossus的GPU数量翻倍至200,000块,包括50,000块新版本的H200GPU。

image.png

【AiBase提要:】

🌟 Colossus配备100,000块Nvidia H100GPU,号称全球最强AI训练系统。

🚀 马斯克计划将Colossus的GPU数量翻倍至200,000块,包括50,000块新版本的H200GPU。

💡 Colossus将为xAI的Grok-2继任者提供强大计算支持,预计将在年底前发布。

4、静态图片转视频已经out了!ComfyUI-AdvancedLivePortrait还可编辑表情

ComfyUI-AdvancedLivePortrait是一款先进的实时动画生成工具,通过强大的面部表情提取和编辑能力,让视频创作更加生动。用户可以从静态照片中捕捉面部表情,并编辑为可调参数,为人物赋予全新情感表达。工具还支持将编辑后的表情插入现有视频,提供灵活后期制作。实时预览功能提高创作效率和精准度,大大降低动画制作门槛。注册到ComfyUI-Manager,操作更便捷。

【AiBase 提要:】

🌟 ComfyUI-AdvancedLivePortrait 能从静态照片提取并编辑面部表情。

🎥 用户可以将编辑后的表情无缝插入到现有视频中。

🚀 实时预览功能提升创作效率,简化动画制作过程。

详情链接:https://top.aibase.com/tool/comfyui-advancedliveportrait

5、腾讯文档「智能扫描」功能升级:纸质材料一键转高清扫描件

腾讯文档近期推出了升级版的“智能扫描”功能,旨在为用户提供更加便捷高效的文档管理体验。这项新功能特别适合开学季,教师和学生需要处理大量资料和文档。用户可以通过腾讯文档小程序或APP访问“智能扫描”工具,提供扫描存档、去除手写和证件管理三大核心功能。

image.png

【AiBase提要:】

📄 扫描存档:将个人笔记、资料、PPT等转换为高清扫描件,方便随时查看和分享。

🖊️ 去除字迹:轻松抹去试卷上的手写痕迹,整理错题,提高学习效率。

🔒 证件管理:将身份证、银行卡等证件转化为高清扫描件,提供便捷管理和安全选项。

6、智谱与荣耀在AI大模型方面签署合作 探索端侧AI智能体验

2024年9月2日,北京智谱华章科技有限公司与荣耀在北京签署了AI大模型技术联合实验室的战略合作协议,标志着双方在人工智能领域的合作迈入了新的阶段。合作旨在推动智能终端领域的大模型技术和应用创新,为用户提供更加智能化和便捷的AI服务,加速各行业迈向通用人工智能时代的步伐。

【AiBase提要:】

🤝 智谱与荣耀签署AI大模型技术联合实验室合作协议,共同探索端侧AI智能体验。

🔍 智谱致力于开发认知智能大模型,荣耀是消费电子领域AI技术领导者

🚀 合作旨在推动大模型技术在消费级终端产业中的落地,加速各行业迈向通用人工智能时代。

7、低调大更新!谷歌在Chrome地址栏悄然集成Gemini AI,@一下就能调用AI助手

谷歌最近在Chrome浏览器进行了一项重大更新,将Gemini AI聊天机器人集成到地址栏中,用户只需输入"@gemini"即可访问Gemini,提供无缝的AI帮助体验。这次更新突显了谷歌将AI作为核心产品的承诺,利用Gemini1.5Flash轻量级版本,使用户能够直接从浏览器访问AI能力。

【AiBase提要:】

🚀 Gemini AI聊天机器人集成到Chrome地址栏,提供无缝AI帮助体验。

🔍 Gemini1.5Flash版本使用户能直接访问AI能力,虽不如专业版,仍有显著改进。

📈 谷歌将AI注入产品套件,Chrome引入多项AI功能,Gemini的集成代表AI优先策略的重大升级。

8、Anthropic将发布最新功能Artifacts系统提示

Anthropic公司即将发布最新功能Artifacts的系统提示,以回应研究者的质疑。Artifacts功能允许用户在Claude聊天界面旁边运行代码片段,已对所有用户开放。系统提示的公开有助于用户理解模型行为,促使AI开发者保持透明。

【AiBase提要:】

📝 Anthropic公司将在未来几周内发布Claude模型的Artifacts系统提示

💻 Artifacts功能允许用户在Claude聊天界面旁边运行代码片段,已对所有用户开放

📜 系统提示的公开有助于用户理解模型的行为,并促使AI开发者保持透明。

9、谷歌开源全新风格转移模型RB-Modulation

谷歌最近开源了一款名为RB-Modulation的全新风格转移模型,该技术突破在人工智能图像处理领域引起了广泛关注。RB-Modulation不仅展现出卓越的图像风格转换能力,还在多个关键技术指标上实现了显著突破。该模型的训练-free特性使用户无需额外训练即可实现高质量的图像风格个性化定制。

image.png

【AiBase提要:】

🔥 个性化控制: RB-Modulation实现风格和内容的个性化控制,无需额外训练。

💡 高保真度: 生成图像忠实于参考风格,避免信息泄漏。

🌟 强大样式描述能力: 能够准确捕捉并重现所需的图像属性。

详情链接:https://huggingface.co/spaces/fffiloni/RB-Modulation

10、AI写作业神器问世:机械臂代笔,学生党的救星还是教育新隐忧?

这篇文章介绍了B站知名UP主极客湾团队打造的AI自动写作业机器人“白日梦”,引发了广泛关注和讨论。该机器人具有自主翻页、自动解答题目、模仿人手书写等功能,展现了AI技术在教育领域的潜力。然而,它也引发了对教育本质的思考和质疑,提醒人们需要平衡科技发展与教育初衷。

QQ20240904-092856.jpg

【AiBase提要:】

⚙️ 白日梦是极客湾团队打造的AI写作机器人,具有自主翻页、自动解答题目、模仿人手书写等功能。

💡2.0版本采用了先进的CoreXY结构和AI模型,提升了稳定性和准确度,能处理多学科题型。

🔮 白日梦的出现引发了对教育方式的思考,科技进步需要与教育初衷平衡,确保技术为教育服务。

11、AI重塑经典!暗黑童话版《美少女战士》引爆网络,单条小红书笔记获赞2.2万

近期,暗黑童话版《美少女战士》在小红书引发热议,AI技术重新演绎经典动漫,展现艺术创作无限可能。观众广泛认可暗黑风格与《美少女战士》结合,体现创新欢迎和经典作品重新诠释兴趣。AI改编成功激发人们想象力和nostalgia,为未来影视改编提供新灵感。

image.png

【AiBase提要:】

🎨 暗黑童话版《美少女战士》在小红书火爆,展现AI技术在艺术创作领域的无限可能。

🌙 AI生成的图像呈现模糊画质和阴暗色调,将元素与格林童话黑暗风格相融合,引发观众怀旧情绪。

🔮 观众广泛认可暗黑风格与《美少女战士》结合,体现创新欢迎和经典作品重新诠释兴趣。

12、英特尔AI PC芯片Lunar Lake重磅发布

英特尔在IFA大会上推出备受期待的Lunar Lake移动处理器,性能提升显著,AI计算能力高达120TOPS。与台积电合作制造,效率核心提高68%,功耗降低30%。新处理器将于9月24日正式上市,支持多种AI功能,部分功能需等到11月开放。

【AiBase提要:】

💻 Lunar Lake处理器提供高达120TOPS的AI计算能力,与台积电合作制造。

⚡ 性能提升显著,效率核心提高68%,功耗降低30%。

🛒 新处理器将于9月24日正式上市,支持多种AI功能,部分功能需等到11月开放。

13、一夜蒸发2790亿美元!Nvidia AI反垄断调查加剧,股价暴跌9%

Nvidia近期面临美国司法部的反垄断调查,导致股价暴跌,市值蒸发近2790亿美元。尽管股价有所回落,但整体仍保持上涨趋势。同时,即将推出的Blackwell系列AI芯片或因设计缺陷延迟发售,面临更多市场竞争挑战。市场动态让人对Nvidia未来发展充满好奇。

【AiBase提要:】

🌐 美国司法部对Nvidia展开反垄断调查,关注其市场主导地位和竞争策略。

📉 Nvidia股价一日内下跌超9%,市值蒸发约2790亿美元,尽管整体仍保持上涨趋势。

🛠️ Nvidia即将推出的Blackwell系列AI芯片可能因设计缺陷延迟发售,面临更多市场竞争挑战。

14、面部识别黑幕大揭露:荷兰强硬出手,Clearview AI遭重罚3300万美元!

荷兰数据保护局对 Clearview AI 违法收集用户图像的行为予以严厉制裁,强调面部识别技术的侵入性和违法行为的严重性。管理层可能面临个人责任追究,以制止违法行为的持续发生。

【AiBase提要:】

🌍 Clearview AI 非法收集用户图像,荷兰数据保护局处以3300万美元罚款。

⚖️ Clearview AI 拒绝承认欧盟法律约束,对罚款合法性持否定态度。

👥 荷兰数据保护局考虑追究 Clearview 管理层的个人责任,以制止违法行为的持续发生。

15、不学AI就OUT!调研显示:71%高管青睐AI技能胜过经验!

2024年微软和LinkedIn发布的年度工作趋势报告显示,AI技能正成为雇主招聘的热门要求。对于职场新人是机遇,但对于资深人士可能带来风险。尽管AI技能受追捧,仅有25%的雇主计划提供培训,许多人主动学习。领导者认为AI对保持竞争力至关重要,但担心衡量和实施。专业人士面临考虑辞职和AI取代工作的压力,需主动学习适应未来挑战。

image.png

【AiBase提要:】

📈71%的高管更青睐AI技能候选人

💻 仅25%公司计划提供AI培训,75%知识工作者自学AI工具

🔄46%员工考虑辞职,担心AI影响工作

16、全球生成式AI将大爆发!预计2030年市场将飙升至1.5万亿美元

生成式AI市场呈现惊人增长,预计到2030年将达到1.5万亿美元,成为未来科技核心。AI软件和服务将成为市场扩张重要推动因素。硬件限制和模型开发问题逐渐显露,未来发展重点在边缘AI芯片专门性和软硬件整合。

image.png

【AiBase提要:】

🚀 生成式AI市场预计到2030年将飙升至1.5万亿美元,成未来科技核心。

💻 AI软件和服务将成为市场扩张重要推动因素,预计到2030年分别占市场32%和55%。

🔑 未来发展重点在边缘AI芯片专门性和软硬件整合,以满足低功耗、高效率应用需求。

举报

  • 相关推荐
  • 大家在看
  • PhotoRestore AI:使用先进的AI技术恢复和着色老照片。

    PhotoRestore AI是一款利用人工智能技术,专门针对老旧照片进行着色和修复的在线服务。它通过先进的算法分析和处理照片,修复划痕、修复褪色,并增强细节,尤其擅长修复黑白或褪色的肖像照片。这项技术的重要性在于它能够帮助人们保存和重温珍贵的记忆,对于家庭历史、文化传承和教育领域都具有重要的价值。PhotoRestore AI提供多种订阅计划,价格合理,适合家庭用户、专业历史研究者和教育工作者使用。

  • Infography:将博客转换为引人注目、易于分享的信息图,由AI驱动。

    Infography是一个利用人工智能技术将复杂博客文章转换为视觉吸引力强、易于分享的信息图的平台。它通过简化信息、提升参与度和增加分享率,帮助营销人员、教育工作者和影响者吸引新受众、轻松重用内容并吸引潜在客户。产品的主要优点包括简化复杂信息、提高参与度和分享性、在社交媒体上吸引注意力、推广特定产品或服务、重用现有内容以及提升SEO。

  • 匡优AI出题:利用AI技术精准生成高质量试题

    匡优AI出题是一款利用先进的人工智能技术,为教育工作者和学生提供试题生成服务的网站。它通过分析教育内容和需求,帮助用户迅速批量生成高质量的试题,解决出题难题。产品背景信息显示,该平台由广州好智信息技术有限公司开发,旨在提高教育效率和质量。产品的主要优点包括精准分析、批量生成、覆盖多个学段和科目,满足不同用户的需求。

  • AI Lyrics Generator:利用AI技术快速生成原创歌词

    AI Lyrics Generator是一个基于人工智能技术的在线歌词生成工具,专为词曲作者、音乐家和创意人士设计。它能够根据用户输入的风格、主题和情感等参数,快速生成原创歌词。这个工具利用先进的机器学习算法,模仿人类创作歌词的过程,为用户提供灵感和创作辅助。AI Lyrics Generator不仅能够节省创作时间,还能拓宽创作视野,帮助用户探索不同的音乐风格和表达方式。

  • Fancy Text Generator:创意文字转换器,轻松生成独特、炫酷的文字效果。

    Fancy Text Generator是一个在线工具,利用AI算法为用户提供多种风格的花式文字生成服务。它支持包括花式字体、emoji装饰、特殊符号在内的多种文字效果,适用于社交媒体、个人签名、艺术创作等场景。该产品的主要优点包括用户友好的界面、快速生成作品的能力、高分辨率输出以及社区分享功能。它免费在线使用,无需下载,适合所有希望在数字平台上展示个性化文字的用户。

  • Flux Lora Online:在线生成精美图片,释放创意潜力。

    Flux Lora Online 是一个在线平台,提供多种 Flux Lora 模型,用于生成各种风格的图像。这些模型包括但不限于写实风格、动漫风格、迪士尼风格等,能够满足不同用户对图像生成的多样化需求。平台采用先进的图像生成技术,提供高分辨率和细节丰富的图像,同时拥有用户友好的界面,简化工作流程,提高生产力。

  • Vadoo AI:AI视频生成器,将文本快速转化为视频。

    Vadoo AI是一个全功能的AI视频生成器,它使用先进的人工智能技术,让用户能够将文本提示快速转化为视频内容。该产品支持多种语言字幕,提供多种视频风格和模板,以及背景音乐和自动缩放等功能,使得视频制作变得简单而高效。Vadoo AI的目标是帮助用户,无论是社交媒体创作者还是企业营销人员,都能轻松创建专业质量的视频内容,以吸引和保持观众的注意力。

  • AI Youtube Shorts Generator:从长视频中生成引人入胜的YouTube短片

    AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。这个工具目前处于0.1版本,可能存在一些bug。

  • Cavela:全球首个虚拟采购代理,连接全球制造商网络

    Cavela是一个创新的虚拟采购代理平台,它通过自动化技术连接全球的供应商网络,为企业提供从供应商匹配、报价编制、样品生产、质量保证到订单交付的一站式服务。Cavela通过其平台,帮助企业降低采购成本,提高效率,同时确保产品质量。它特别适合需要全球采购资源的中小型企业和初创公司,帮助他们在竞争激烈的市场中快速响应市场需求。

  • Landerino:最简洁的网页构建器,设计至上

    Landerino是一个创新的网页构建平台,它通过提供简单易用的界面,让用户能够快速创建、编辑和发布落地页。它不仅支持实时编辑和预览,还提供了强大的分析工具,帮助用户优化页面并进行A/B测试。Landerino的目标是让每个人都能轻松地构建和管理自己的网页,无需专业的技术背景。它通过简化网页制作流程,降低了维护成本,使内容创造成为焦点。

  • Mneme AI:在设备上与您的笔记进行对话,提升生产力。

    Mneme AI 是一款运行在iPhone上的本地AI助手应用,它允许用户通过与个人笔记、文档和书籍的对话来提高工作效率。这款应用完全离线运行,确保了用户数据的隐私和安全。Mneme AI 通过提供个性化的响应,帮助用户整理思绪和知识,支持用户使用内置文本编辑器记录新笔记或添加PDF文档。它支持英语,并推荐在iPhone 14或更新型号上使用以获得最佳性能。

  • AI-Faceless-Video-Generator:利用AI生成视频脚本、语音和会说话的头像

    AI-Faceless-Video-Generator是一个利用人工智能技术,根据话题生成视频脚本、语音和会说话头像的项目。它结合了sadtalker进行面部动画,gTTS生成AI语音和OpenAI语言模型生成脚本,提供了一个端到端的解决方案,用于生成个性化视频。该项目的主要优点包括脚本生成、AI语音生成、面部动画创建以及易于使用的界面。

  • FLUX.1-dev-LoRA-Dark-Fantasy:生成幻想生物和角色的AI模型

    FLUX.1-dev-LoRA-Dark-Fantasy是由Shakker AI的GUIZANG(歸藏)训练的LoRA模型,专注于生成幻想生物和角色。该模型受到Klee、Odilon Redon、Eyvind Earle等艺术家的影响,能够生成具有电影质感、复杂光影效果和精细细节的图像。模型遵循flux-1-dev-non-commercial-license,适用于非商业用途。

  • 通义万相AI视频生成:利用AI技术,将文字和图像转化为创意视频。

    通义万相AI创意作画是一款利用人工智能技术,将用户的文字描述或图像转化为视频内容的产品。它通过先进的AI算法,能够理解用户的创意意图,自动生成具有艺术感的视频。该产品不仅能够提升内容创作的效率,还能激发用户的创造力,适用于广告、教育、娱乐等多个领域。

  • Windows Agent Arena:用于测试和开发AI代理的可扩展开源框架

    Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。它通过模拟真实的Windows环境,允许代理自由操作,并使用与人类用户相同的应用程序、工具和网络浏览器来解决任务。WAA通过Azure实现可扩展性和并行化,能够在短短20分钟内完成完整的基准测试评估。

  • VELS by Kaiden AI:AI驱动的模拟训练,提升沟通技能。

    VELS by Kaiden AI是一个基于人工智能的模拟训练平台,提供定制化、反馈丰富的模拟场景,帮助用户准备各种交流互动。该平台通过创建逼真的训练场景和AI虚拟对话伙伴,模拟真实世界的交流环境,让用户在安全的环境中练习和提高沟通技能。VELS通过实时反馈和性能分析,为用户提供个性化的训练体验,帮助他们在各种行业和角色中提升表现。

  • Selfplanr:规划你的高中四年,迈向梦想大学。

    Selfplanr是一个为高中生设计的在线规划工具,旨在帮助学生规划他们的高中生涯,以实现进入理想大学的目标。通过个性化的目标设定、动态的四年规划、每周任务安排、与导师和同伴的协作规划以及动态进度跟踪,Selfplanr帮助学生构建全面而独特的简历,发现学术之外的无数机会,如实习、奖学金、研究和志愿活动。

  • GoMaxAI:一站式AI服务,提供多样化智能解决方案。

    GoMaxAI是一个集成了多种AI功能的平台,旨在为用户提供包括3D视频创建、智能问答、AI绘画、文档分析和思维导图等多种智能服务。它通过先进的AI技术,帮助用户在影视制作、设计、艺术创作、信息处理等领域提高效率和创造力。

  • XVERSE-MoE-A36B:多语言大型语言模型,支持多领域文本生成。

    XVERSE-MoE-A36B是由深圳元象科技自主研发的多语言大型语言模型,采用混合专家模型(MoE)架构,具有2554亿的总参数规模和360亿的激活参数量。该模型支持包括中、英、俄、西等40多种语言,特别在中英双语上表现优异。模型使用8K长度的训练样本,并通过精细化的数据采样比例和动态数据切换策略,保证了模型的高质量和多样性。此外,模型还针对MoE架构进行了定制优化,提升了计算效率和整体吞吐量。

  • Peter Cat:智能答疑机器人解决方案,助力GitHub社区维护者和开发者

    Peter Cat 是一个专为社区维护者和开发者打造的智能答疑机器人解决方案。它通过对话式答疑 Agent,配置系统、自托管部署方案和便捷的一体化应用SDK,让用户能够一键创建智能答疑机器人,并快速集成到各类官网或项目中,为社区提供更高效的技术支持生态。

今日大家都在搜的词: