站长之家(ChinaZ.com)5月18日 消息:5月18日,百度智能云联合中国文物交流中心、极幕科推出国内首个文博虚拟宣推官“文夭夭”。
据了解,文夭夭的形象制作和“听说读写“等AI能力,均依托于百度去年发布的智能数字人平台“百度智能云曦灵”。
未来,文夭夭将在各大博物馆持证上岗,提供讲解、导览、主持对话、直播等服务。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
AI时代,百度备受关注。2024年2月28日,百度发布最新财报,2023年第四季度营业收入为349.51亿元,同比增长6%净利润为77.55亿元,同比增长44%;2023年全年营业收入为1345.98亿元,同比增长9%净利润为287亿元,同比增长39%。对百度不妨多一些耐心。
真城市车道级导航”已覆盖全国超300城普通道路。该功能将支持极越领航辅助驾驶开城,后续将陆续登陆更多车机,并在CarPlay、HiCar等投屏设备上同步体验。仅仅不到三个月,就完成了全国360城数据制作,并即将在全国上线,无需额外设置,即可开启真城市车道级导航。
成功的商业模式不是靠预测市场是通过塑造市场来实现。在当今不断发展的科技领域中,生成式AI的兴起正如一股不可忽视的巨浪,将商业舞台推向了前所未有的变革,以生成式AI为代表的一系列创新AI技术,正在通过塑造市场、引领趋势,实现商业价值的最大化。这需要百度与合作伙伴共同探索,为社会创造更多的价值。
百度集团高级副总裁、移动生态业务群组负责人何俊杰公布了2024年第一季度的目标与关键成果。其核心目标为:通过引领AI行业的发展,重构具有代表性的应用场景,以实现盈利增长。百度副总裁何俊杰强调,2024年,百度将重点依靠AI技术实现盈利增长,并通过短剧等创新方式提升用户活跃度,进一步巩固和拓展其市场地位。
AIRLOOK与百度视觉技术部联合发布了中国地信领域的第一个大空间高精度3DGS解决方案,率先实现了测绘级SfM与3DGaussianSplatting逆渲染技术的完美融合,为行业提供更强大的显式编辑能力和更低算力需求的实时渲染能力,进一步降低开发和部署门槛,在双方的合作下,将加快创新性技术在地理信息领域的应用。GIR重建及重光照渲染效果打造数字孪生城市的“新引擎”随着数字经济的快速发展,地理信息数据已经成为数字经济的重要组成部分,对于推动经济发展和提升社会治理水平具有重要意义。3DGS-PBR的引入,让重建的3DGS结果可无缝与其他CG渲染内容融合。
BaiduComate在2024年3月1日进行了重磅升级,推出了两大重磅能力,分别是“Comate”开放平台和AutoWork“私人研发助理”。1.Comate开放平台:2.AutoWork私人研发助理:总的来说,BaiduComate此次升级更贴合软件研发现场,提供易用的研发平台、丰富的插件基础能力、自主定制能力以及企业接入私域知识与自有能力,帮助企业低成本打造适合组织的自有智能代码助手,提升软件研发体验和效率。
继ChatGPT后,OpenAI又在文生视频的领域中扔下了一颗深水炸弹,引爆了海内外AI圈。2月16日,OpenAI的文字生成视频模型——Sora首次面世。参考资料:1.《OpenAI最新文生视频模型Sora技术能力解密:基于Patch的数据规范性、多模态Prompt支持、物体持久性和远程相干性能力》,GarvinLi;2.《Sora模型发布,哪些行业要变天?》,IT魔术师;3.《国内复现Sora能力几何?李维:不存在跨不过的技术门槛》
初创公司CognitionAI推出全球首个AI程序员Devin,其最大突破在于大大提升计算机推理和规划能力。Devin掌握全栈技能、自学新技术、构建和部署应用程序、自主查找并修复Bug、训练和微调自己的AI模型等多项能力。CognitionAI目前已获得硅谷投资大佬彼得蒂尔的FoundersFund基金领投的2100万美元A轮融资。
程序员怕是真要失业了。首个AI软件工程师一亮相,直接引爆整个科技圈。PerplexityAICEO给出了个高度的肯定:这应该是任何Agent的第一个演示。
快科技3月17日消息,在中国电动汽车百人会论坛(2024)上,小鹏汽车董事长何小鹏宣布正式进军10-15万元A级车全球市场,致力于打造年轻人的第一台AI智驾汽车”。随后余承东上台没多久就开始调侃:我知道这个过去,在智能泊车、智能驾驶方面,国内车厂做得最好的是何小鹏,但是我们来了以后呢,改写这个行业哈。”余承东表示,我们的ADAS高阶智能驾驶、智能座舱等等是用户体验最好的,这个行业很卷,所以我们提供的技术帮助大家一起来卷,把更好的体验提供给消费者。在余承东分享完后,百度智能驾驶事业群组总裁王云鹏演讲中表示:确实刚才?
data.ai是第一个统一数据AI公司,结合消费者和市场数据与人工智能的力量,为用户提供深入洞察,帮助提升数字性能。
NVIDIA Blackwell平台使用六项变革技术推动加速计算,能够在减少成本和能耗的同时,实现实时生成AI和处理高达数万亿参数的大型语言模型。
OMG(Once More Generalization)是一个开源的图像超分辨率工具,它利用深度学习技术来提高图像的分辨率。该项目旨在通过AI模型增强图像质量,使其在放大后仍然保持清晰和细腻。
Upscale.media插件使用先进的AI技术,提供图片放大和增强功能,只需几次点击即可简化您的图像处理工作流程。成千上万的用户已经使用Upscale.media来节省时间并获得出色的结果。
Face to Many 可以将一张面部照片转变成多种风格,包括 3D、表情符号、像素艺术、电子游戏风格、粘土动画或玩具风格。用户只需上传一张照片,然后选择想要转换的风格,即可轻松创建奇妙有趣的面部艺术作品。产品提供多种参数供用户自定义,包括降噪强度、提示强度、深度控制强度和 InstantID 强度。
DarkGPT是一个基于GPT-4-200K的开源OSINT(开放源码情报)助手,旨在帮助用户在泄露的数据库上执行查询。它提供了一个人工智能助手,可以在传统的OSINT流程中发挥作用。
Chaturji是一个团队分享为焦点的AI助手,可以让团队访问世界上最好的AI,编写、保存、组织提示,共享提示和协作,以及获取分析和监控使用情况。
Writesonic的AI文章生成器支持生成事实准确、含引用和内部链接的文章,优化SEO,助力内容快速排名。适用于内容写手、SEO专家和机构,能在数分钟内完成文章创作,降低成本,提升效率。
NVIDIA Project GR00T是一种通用基础模型,可在仿真和真实世界中改变人形机器人的学习方式。通过在NVIDIA GPU加速模拟中进行训练,GR00T使得人形机器人能够从少量的人类演示中通过模仿学习和NVIDIA Isaac Lab进行强化学习,并可从视频数据生成机器人动作。GR00T模型接受多模态指令和过去的交互作为输入,并输出机器人需要执行的动作。
SystemAnimatorOnline是一个基于AI的全身动作捕捉和扩展现实(XR)解决方案,旨在为XR Animator提供支持。该项目利用人工智能技术来捕捉和模拟全身动作,适用于XR领域的动画制作和交互设计。
Prefind 是一款智能 AI 搜索引擎,采用 GPT-4 和 Claude-3 技术,提供多模型比较和快速搜索等功能。完全免费。
Prentus是一款能够帮助您更快地找到理想工作的插件。它集职位追踪、扩展社交网络和AI辅助快速申请于一体。您可以追踪职位、扩展人脉网络,并利用AI辅助快速生成求职邮件和填写申请表格。Prentus能够自动提取职位详情,并提供AI工具生成个性化的简历、求职信和面试问题。让您成为每个职位的顶级申请者。
Kater是一个AI数据分析工具,可以快速转换数据,遵循软件开发最佳实践,使数据可被任何人使用AI。它可以通过以英语提问的方式与数据进行交互,提供智能标签、分类和数据整理功能,并帮助用户定义语义层、度量层和文档等。Kater还可以将验证的答案存储在查询库中,以便提供更准确的回答。
Blur ID 是一款自动打码工具,能够检测照片/截图中包含的隐私文本、头像和二维码,并自动打码以保护隐私。用户可以自定义头像实现沉浸式打码效果。该应用程序完全在本地运行,无需服务器,保证隐私安全。支持打码的内容包括人脸、敏感文字、头像、二维码和条形码。软件通过不断优化模型来提高识别准确率。Blur ID提供了免费版本及付费的订阅服务,付费版本提供更多高级功能。
NextStarterAI是一个全面的开发套件,旨在帮助用户快速启动SaaS、AI工具或其他任何类型的Web应用程序。它提供了Next.js模板、着陆页组件、支付系统集成(Stripe/Lemon Squeezy)、营销指南、数据库解决方案(Supabase)、SEO标签、博客板块、邮件发送服务(Mailgun)等,以及终身更新。
Stable Video 3D是Stability AI推出的新模型,它在3D技术领域取得了显著进步,与之前发布的Stable Zero123相比,提供了大幅改进的质量和多视角支持。该模型能够在没有相机条件的情况下,基于单张图片输入生成轨道视频,并且能够沿着指定的相机路径创建3D视频。
包阅AI阅读助手支持一键总结、AI问答、多语言翻译,涵盖网页、论文文献、法律文档、学术科研、产品手册、市场报告、电子书等多种内容类型。功能包括总结提炼、深度理解、问答解惑、文献检索、文案润色等。定位于帮助用户高效阅读和理解各类文本资料。
Griffon 是第一个具有本地化能力的高分辨率(超过1K)LVLM,可以描述您感兴趣的区域中的所有内容。在最新版本中,Griffon 支持视觉语言共指。您可以输入图像或一些描述。Griffon 在 REC、目标检测、目标计数、视觉/短语定位和 REG 方面表现出色。定价:免费试用。
Skyvern是一个自动化工具,它结合了大型语言模型(LLMs)和计算机视觉技术,用于自动化基于浏览器的工作流程。它提供了一个简单的API端点,可以完全自动化手动工作流程,替代易碎或不可靠的自动化解决方案。
Creatie.ai不仅仅是一个设计工具,它体现了对AI在不取代设计过程的前提下增强设计潜力的信念。Creatie.ai通过其多功能的AI设计,让用户的想象力无限扩展,观察设计如何栩栩如生。