1月8日消息,百度AI体系进行组织架构升级,原AIG(AI技术平台体系)、TG(基础技术体系)、ACG(百度智能云事业群组)整体整合为“百度人工智能体系”(AI Group、缩写为AIG)。新AIG包含技术中台群组(TPG)和智能云事业群组(ACG)两大群组组成,继续由百度CTO王海峰整体负责。同时智慧政务、智慧医疗、智慧金融、智能客服与营销四大业务板块升级为四大事业部。
(举报)
1月8日消息,百度AI体系进行组织架构升级,原AIG(AI技术平台体系)、TG(基础技术体系)、ACG(百度智能云事业群组)整体整合为“百度人工智能体系”(AI Group、缩写为AIG)。新AIG包含技术中台群组(TPG)和智能云事业群组(ACG)两大群组组成,继续由百度CTO王海峰整体负责。同时智慧政务、智慧医疗、智慧金融、智能客服与营销四大业务板块升级为四大事业部。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
4月16日,Create2024百度AI开发者大会在深圳举行。百度创始人、董事长兼首席执行官李彦宏发表主题为「人人都是开发者」的演讲,现场展示了「组团出道」的文心大模型系列以及AgentBuilder、AppBuilder、ModelBuilder三大开发神器。对于AI时代和每个个体来说,百度文心智能体平台正像阿基米德的支点、纳瓦尔的杠杆,给予每个人机会,让每个人有可能成为「超级个体」。
站长之家4月6日消息:自OpenAI于2022年推出具有里程碑意义的ChatGPT以来,人工智能技术在全球范围内引起了广泛关注。作为科技界的巨头,Google也在积极布局,力图在这一领域占据领导地位。Google能否克服内部的组织和文化障碍,发挥其创新能力,以及如何在保持现有业务的同时,敢于在AI时代做出大胆的战略调整。
Hume.AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI,采用了情感大语言模型技术。如果您是研究人员、开发者或企业,不妨尝试Hume.AI提供的技术,探索其在情感计算领域的应用和潜力。
英国科技、创新与技术部门的官员已开始起草监管人工智能模型的立法。目前尚不清楚未来的监管将如何与英国已存在的AI安全研究所交汇,该研究所已对最强大的AI模型进行安全测试。任何潜在的法案仍有很长的路要走。
4月16日,Create2024百度AI开发者大会在深圳举行。百度创始人、董事长兼首席执行官李彦宏以“人人都是开发者”为题发表演讲,为全球开发者带来“组团出道”的文心大模型系列以及AgentBuilder、AppBuilder、ModelBuilder三大“开箱即用”的AI开发工具。百度欢迎所有企业、开发者、生态伙伴,共同把握智能体带来的新机遇,开辟下一个流量黄金时代。
美国和英国于周一宣布了一项新的合作伙伴关系,共同关注人工智能安全科学,针对即将到来的下一代版本引发的日益关注的问题。美国商务部长吉娜・雷蒙多和英国科技部长米歇尔・多纳兰在华盛顿签署了一项谅解备忘录,共同开发先进的AI模型测试,这是继去年11月在布莱切利公园举办的AI安全峰会上宣布承诺后的进展。“那些后果可能是灾难性的,因此我们对某些模型被用于这种能力必须有零容忍。
谷歌正在对Android、Chrome和谷歌硬件部门进行重大重组:它们即将合并!谷歌硬件部门高级副总裁RickOsterloh将领导新的「平台与设备」部门。」希望这能解释清楚一切。
近日一份新报告显示,越来越多的公司开始担心广告商将生成式人工智能融入其工作流程。在这场人类艺术家与生成式人工智能之间的“冷战”中,企业们成为了意想不到的盟友。更新后的指南现在建议企业在与广告公司的协议中包含关于人工智能和同意的条款,公司似乎开始遵循这一建议。
之前仅限于Pixel设备和付费订阅者的人工智能驱动的照片编辑功能,现已免费向所有GooglePhotos用户开放。这些功能包括MagicEraser、PhotoUnblur、肖像光等,让用户能够更方便地编辑和优化照片。这也反映了科技公司在人工智能应用于日常生活场景方面的不断探索和创新。
百度智能云与迪思传媒合作开发的AI视频创作模型D&S-AlVideo正式上线,并集成至迪思AI智链。D&S-AIVideo凭借其强大的计算与数据分析能力,可以实现对海量视频素材的智能拆分与标签配置,并依托迪思AI智链的生文模型,实现视频的一键生成。迪思传媒已经将一念用于营销活动中,如只需告诉一念“帮我生成一个,大模马自达CX-50的视频宣传文案”型即可生成脚本、深度理解内容、进行画面抽取、匹配音乐、字幕、配音,5分钟内生成一支符合短视频平台的竖版创意视频。
CharAI是一个创新的AI角色创作平台,它利用先进的人工智能技术,帮助用户快速创建和定制个性化的虚拟角色。该平台的主要优点在于其高度的灵活性和易用性,用户可以轻松地调整角色的外观、动作和表情,以满足不同的设计需求。CharAI的背景信息显示,它是由一群对AI和角色设计充满热情的专业人士开发的,旨在为用户提供一个简单、高效的创作环境。目前,该平台的价格定位尚未明确,但考虑到其创新性和潜在的市场价值,可能会有一定的收费模式。
Neta Art XL V1.0是一款易于使用的SDXL动漫模型,它在角色视觉叙事中提供了更好的稳定性和解剖学准确性。它支持广泛的CFG范围(5 - 20),并具有很好的正交风格,可以轻松结合创造新风格。此外,该模型在维持稳定性、提示跟随能力和解剖学准确性方面表现出色,即使在具有挑战性的姿势或摄像机角度下也是如此。
Instant Refactor 是一款编程辅助工具,旨在帮助开发者提高代码重构的效率。它通过自动化的方式识别代码中的模式,并提供重构建议,从而减少手动重构的时间和精力消耗。该工具支持多种编程语言,具有用户友好的界面,可以帮助开发者更快地进行代码优化和维护。
Hyper-SD是一个创新的图像合成框架,它通过轨迹分割一致性模型和低步数推理的优势,实现了高效的图像合成。该框架结合了ODE轨迹保留和重构的优势,同时通过人类反馈学习进一步提升了性能,并通过分数蒸馏技术增强了低步数生成能力。Hyper-SD在1到8步推理步骤中实现了SOTA性能,特别适合需要快速且高质量图像生成的应用场景。
Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。
有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。
蝉镜是一个在线数字人视频创作平台,利用 AI 简化视频创作过程,提供 AI 数字人播报、短视频制作、分身定制等服务。广告营销、跨境电商、短视频口播等领域的用户可以在此提升创作效率、降低成本。
SC-GS是一种新型表示技术,将动态场景的运动和外观分别用稀疏控制点和密集高斯函数表示。它使用少量控制点学习紧凑的6自由度变换基,这些基可通过插值权重在局部插值,得到3D高斯函数的运动场。它采用变形MLP预测每个控制点的时变6自由度变换,降低学习复杂度,增强学习能力,实现时空连贯的运动模式。同时联合学习3D高斯函数、控制点的规范空间位置和变形MLP,重建3D场景的外观、几何和动态。在训练过程中,控制点的位置和数量会自适应调整以适应不同区域的运动复杂度,并采用尽可能刚性的损失函数强制运动的空间连续性和局部刚性。由于运动表示的显式稀疏性和外观分离,该方法实现了用户控制的运动编辑,同时保留高保真度外观。大量实验表明,该方法在新视图合成和高速渲染方面优于现有方法,并支持新的保留外观的运动编辑应用。
XTuner是一个为大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)设计的高效、灵活且功能齐全的微调工具包。它支持在几乎所有GPU上进行LLM和VLM的预训练和微调,能够自动调度高性能操作,如FlashAttention和Triton内核,以提高训练吞吐量。XTuner与DeepSpeed兼容,支持多种ZeRO优化技术。它还支持各种LLMs和VLM(如LLaVA),并设计了良好的数据管道,能够适应任何格式的数据集。此外,XTuner支持多种训练算法,包括QLoRA、LoRA和全参数微调,使用户能够选择最适合其需求的解决方案。
Neta是一个结合了AI技术的网站,用户可以自定义虚拟角色的服装,并通过AI技术让角色栩栩如生。用户可以与这些虚拟角色一起踏上冒险旅程,探索奇妙的世界,培养深厚的情感联系。Neta提供了一个充满想象力和创造性的平台,让用户在虚拟世界中体验不同的生活和情感。
VideoGigaGAN是一款基于大规模图像上采样器GigaGAN的视频超分辨率(VSR)模型。它能够生成具有高频细节和时间一致性的视频。该模型通过添加时间注意力层和特征传播模块,显著提高了视频的时间一致性,并使用反锯齿块减少锯齿效应。VideoGigaGAN在公共数据集上与最先进的VSR模型进行了比较,并展示了8倍超分辨率的视频结果。
Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型,基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象,同时减少了回答中表情符号的使用,使得回答更加正式。
SAM是一个先进的视频对象分割模型,它结合了光学流动和RGB信息,能够发现并分割视频中的移动对象。该模型在单对象和多对象基准测试中均取得了显著的性能提升,同时保持了对象的身份一致性。
Picture to Text是一款在线图片文字识别工具,能够批量提取和复制图片中的文字内容。它免费转换照片为可编辑的文字。
HueMankey 是一个为开发者提供的用户人像 API。它能够为每个用户分配一个独特的人像头像,支持批量请求和直接存储在平台上。它提供轻量级的图像数据,动态适应用户规模,并具备灵活的订阅计划。
使用我们的专业混音和母带处理服务,将您的音乐推向新的高度。通过AI的力量,将您的音轨转化为令人惊叹的杰作,让它在竞争激烈的音乐行业中脱颖而出。可靠的交付时间,无限修订,保证退款。
Suno AI是一个专门用于生成歌曲歌词的在线工具。它只需指定一个歌曲主题,就能生成完整的歌词,包括歌词内容、旋律和伴奏。Suno AI可以生成2分钟的完整歌曲,支持各种音乐风格和流派。用户可以免费使用Suno AI网站或Discord频道生成歌曲。同时,Suno AI还提供付费版本,提供更多的生成点数和商业使用权。
Ongkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏好进行个性化定制,还能记住以前对话的上下文,以便进行更连贯、有意义的交互。
X Me是一个AI头像视频生成工具,通过输入文本即可快速生成个性化的AI头像视频。它使用轻量级的AI模型,无需复杂的训练过程,快速生成逼真的数字人物视频。X Me提供多种AI名人头像供用户选择,并支持将用户自己的面部特征和声音克隆到生成的头像视频中。用户可以根据自己的喜好和需求,自由创造个性化的AI头像视频。
Portrait Studio Pro是一款AI生成的专业商务头像服务。用户只需上传几张照片,我们的AI引擎将生成完美的商务照片,适用于LinkedIn等场景,无需进行实际拍摄。价格实惠,仅需191美元起,支持14天退款保证。