站长之家(ChinaZ.com) 12 月 19 日消息:据媒体报道,百度与上海新高度旅游公司合作推出的全球首批人工智能双层观光车驶上上海街头,开始试运行。
图片版权所属:站长之家
据介绍,该巴士搭载了百度大脑的先进技术,从外观看起来与传统的巴士并没有太大区别,在车门口设置了一个刷脸屏,应用了百度人脸识别技术,游客只需刷脸上下车。
除此之外,在驾驶员座位附近还有两台百度的共享WiFi翻译机,能够提供智能语音翻译、智能问答、语音导览等多种功能。
(举报)
站长之家(ChinaZ.com) 12 月 19 日消息:据媒体报道,百度与上海新高度旅游公司合作推出的全球首批人工智能双层观光车驶上上海街头,开始试运行。
图片版权所属:站长之家
据介绍,该巴士搭载了百度大脑的先进技术,从外观看起来与传统的巴士并没有太大区别,在车门口设置了一个刷脸屏,应用了百度人脸识别技术,游客只需刷脸上下车。
除此之外,在驾驶员座位附近还有两台百度的共享WiFi翻译机,能够提供智能语音翻译、智能问答、语音导览等多种功能。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
今天下午,2000元档旗舰级AI手机魅族Lucky08正式发布,新机搭载FlymeAIOS,拥有超过100项实用的AI功能。AI功能包括AI搜索、AI即圈即搜、A系统化全自动接听、AI通话半自动接听、AI通话总结、AI场景助手。AI一键直达支持一键AI搜索、一键AI语音连麦、一键AI视频连麦、一键AI识曲、一键AI打车、一键AI微信视频、一键AI打卡、一键AI抢单。
2024年9月24日10时31分,国星宇航的捷龙三号遥四火箭在山东海阳成功发射,八颗卫星中包括国星宇航自己的三颗。9月25日20时46分,国星宇航试验团队通过地面站,以遥控指令形式,上注AI任务至卫星。国星宇航将建设实现自主可控的star-compute”组网,并推进天数天算”和下一步的地数天算”项目。
9月13日,钛动科技携手Google联合举办《智领增长:AI营销策略创新与实战》主题论坛活动。蓝驰创投、HiDream智象未来惊喜亮相,行业头部权威数据平台Adjust、SensorTower强势加盟,为与会精英带来AI营销的最佳路径分享。钛动科技会紧抓AI发展和增长趋势,积极探索其在营销领域的创新应用,以智慧引领增长,以实战铸就辉煌。
快科技9月26日消息,在中国信通院最新发布的全球5G标准必要专利排名榜单中,小米取得了不错的成绩,其排名跃升2位,成功跻身全球第八,国内前三。截止2023年底,小米技术研发已进入12个技术领域,包括5G移动通信技术、大数据、云计算及人工智能等,总体细分领域达99项。在大力投入底层技术研发的同时,小米高度重视知识产权的保护,截至2024年06月30日,小米在全球获得专利授权超过4万项,在全球审查中专利数量超过3.2万件。在5G标准必要专利方面,小米的增速更是位居中国企业第一,全球有效专利族占比从去年的4.10%提升至4.62%。据了解,
2024年9月24日,AIMarket正式宣布脱离其母公司ICE,成为独立运营的金融科技平台,这一举动无疑为全球金融市场注入了新的活力。虽然ICE不再直接参与AIMarket的日常决策与运营,但它仍以股东身份支持其发展,携手迈向共同繁荣的未来。反向期权的出现,将为市场带来更大的流动性,进一步巩固AIMarket在全球金融市场中的领导地位。
视频灵感源自网球运动中的击球动作,“一拍即合”既是球拍与球完美配合的瞬间,也是世界一流品牌海尔与网球追求卓越精神的契合,彰显出为全球用户打造高端高品质生活,携手共赴“美好生活”的品牌理念。品牌实力“一拍即合”中网作为亚洲地区最具领导力、赛事总奖金最多、影响力最大的综合国际网球赛事,覆盖 172个国家和地区,全球累计电视转播播出时长9691小时,其中中国大陆不重复电视观众收看达3558万。年位居市场TOP1;在新西兰,斐雪派克稳居白电市场TOP1。
小鹏汽车今日宣布,新车型小鹏P7将于10月10日进行全球首次亮相,宣传口号为“因AI生,越级登场”。小鹏P7的官方宣传中,它被誉为“全球首款AI汽车”。新的智能驾驶方案不受城市、路线、路况的限制,能够实现从“门到门”以及“车位到车位”的全程自动驾驶功能。
今日,应用数据分析机构SensorTower,公布了8月中国手游发行商全球收入排行榜。今年8月共,34个中国厂商入围全球手游发行商收入榜TOP100,合计吸金20.9亿美元,占本期全球TOP100手游发行商收入37.3%。之后游戏陆续推出符文大乱斗限时活动,新英雄、新皮肤等内容,使得8月收入环比提升33%。
2024年9月5日,三星电子宣布开通OneUI6.1.1更新[1],将最新的GalaxyAI功能扩展至更多的Galaxy设备中。无法完全保证生成图片的准确性和可靠性。无法完全保证生成图片的准确性和可靠性。
中国智能锁品牌正在全面赶超国际同行,引领全球智能锁市场。9月25日,国货品牌德施曼智能锁在北京举行品牌新势能成果发布会。企业需要根据市场需求的变化不断调整产品策略和服务模式以满足消费者的多样化需求。
Arc Search 是一款现代、支持人工智能的移动浏览器,专注于让用户更快地找到答案,而不会受到互联网的干扰。它通过智能搜索技术,帮助用户过滤掉不必要的信息,直接定位到他们需要的答案,从而提高搜索效率。
Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。
o1是一个实验性的项目,旨在通过使用大型语言模型(LLM)来创建推理链,帮助模型解决通常难以处理的逻辑问题。它支持Groq、OpenAI和Ollama后端,通过动态推理链让模型能够“思考”并解决问题。o1展示了仅通过提示就能显著提高现有模型的逻辑推理能力,而无需额外训练。
Minionverse是一个基于AI的创意工作流,它通过使用不同的节点和模型来生成图像。这个工作流的灵感来自于一个在线的glif应用,并且提供了一个视频教程来指导用户如何使用。它包含了多种自定义节点,能够进行文本替换、条件加载、图像保存等操作,非常适合需要进行图像生成和编辑的用户。
Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练,为视频和语音应用设定了准确性标准。Rev AI还提供实时流媒体转录、人类转录、语言识别、情感分析、主题提取、总结和翻译等服务。Rev AI的技术优势在于低词错误率、对性别和种族口音的最小偏见、支持更多语言以及提供最易读的转录文本。此外,它还符合世界顶级的安全标准,包括SOC II、HIPAA、GDPR和PCI合规性。
RobotFingerPrint是一种用于多种机械手抓取合成的统一坐标空间的创新表示方法。它使用经度和纬度作为坐标,在三维空间中形成一个球体的二维表面,所有机械手共享此坐标空间。该技术通过将机械手的掌心表面映射到统一的坐标空间,并设计条件变分自编码器来预测给定输入对象的统一坐标,从而建立机械手与对象之间的对应关系,用于优化问题以解决抓取姿态和手指关节。该技术能显著提高多种机械手抓取合成的成功率和多样性。
Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。该技术代表了3D重建领域的最新进展,可以显著提高3D内容的生成效率和质量。Flex3D的开发得到了Meta的支持,并且团队成员在3D重建和计算机视觉领域有着深厚的背景。
Helpful DoggyBot是一个四足机器人室内移动操作系统,它通过前端夹持装置进行物体操作,使用在模拟环境中训练的低级控制器实现敏捷技能,如攀爬和全身倾斜。此外,它还结合了预训练的视觉-语言模型(VLMs)进行语义理解和命令生成。该系统在没有实际数据收集或训练的情况下,能在未见过的环境中零样本泛化完成任务,如按照用户的指令在攀爬过后的床边取回随机放置的玩具,成功率达到60%。
Paper Central 是 Hugging Face 推出的一个全面、便捷的学术平台,它将arXiv、Hugging Face 论文页、模型、数据集、Space、GitHub 和会议论文集等多个来源的开源学术资源整合在一起,帮助研究人员和开发者快速获取并使用开源资源。
WebLLM是一个高性能的浏览器内语言模型推理引擎,利用WebGPU进行硬件加速,使得强大的语言模型操作可以直接在网页浏览器内执行,无需服务器端处理。这个项目旨在将大型语言模型(LLM)直接集成到客户端,从而实现成本降低、个性化增强和隐私保护。它支持多种模型,并与OpenAI API兼容,易于集成到项目中,支持实时交互和流式处理,是构建个性化AI助手的理想选择。
Audio-to-Face 是 NVIDIA NIM 提供的一项技术,能够将音频流实时转换为面部表情,用于唇形同步和面部表演。这项技术主要应用于数字人领域,通过先进的机器学习算法,实现高度逼真的面部动作生成。它不仅能够提升数字人物的自然度和真实感,还能够在游戏、电影制作、虚拟现实等领域提供强大的支持。
Flux_小红书真实风格模型是一款专注于生成极度真实自然日常照片的AI模型。它利用最新的人工智能技术,通过深度学习算法,能够生成具有小红书真实感风格的照片。该模型特别适合需要在社交媒体上发布高质量、真实感照片的用户,以及进行艺术创作和设计工作的专业人士。模型提供了多种参数设置,以适应不同的使用场景和需求。
FLUX1.1 [pro] 是 Black Forest Labs 发布的最新图像生成模型,它在速度和图像质量上都有显著提升。该模型提供六倍于前代的速度,同时改善了图像质量、提示遵循度和多样性。FLUX1.1 [pro] 还提供了更高级的定制化选项,以及更优的性价比,适合需要高效、高质量图像生成的开发者和企业。
PuLID-Flux ComfyUI implementation 是一个基于ComfyUI的图像处理模型,它利用了PuLID技术和Flux模型来实现对图像的高级定制和处理。这个项目是cubiq/PuLID_ComfyUI的灵感来源,是一个原型,它使用了一些方便的模型技巧来处理编码器部分。开发者希望在更正式地重新实现之前测试模型的质量。为了获得更好的结果,推荐使用16位或8位的GGUF模型版本。
Youtube-Whisper是一个基于Gradio的应用程序,它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。这个工具对于需要将视频内容转化为文本以进行分析、存档或翻译的用户来说非常有用。它利用了最新的人工智能技术,提高了视频内容的可访问性和可用性。
OpenFLUX.1是一个基于FLUX.1-schnell模型的微调版本,移除了蒸馏过程,使其可以进行微调,并且拥有开源、宽松的许可证Apache 2.0。该模型能够生成令人惊叹的图像,并且只需1-4步即可完成。它是一个尝试去除蒸馏过程,创建一个可以微调的开源许可模型。
LiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。它通过集成OpenAI的实时API和LiveKit的WebRTC基础设施,提供了创建语音助手的快速入门指南,包括语音识别(STT)、语言模型(LLM)和文本转语音(TTS)的流水线。此外,它还支持创建语音到语音代理、接听和响应来电、以及代表用户拨打电话的功能。
BeaGo是一款由Rhymes Technology Inc开发的智能搜索应用,它利用先进的AI技术,能够理解用户的需求,快速找到可靠和高质量的答案。无论是解决复杂问题还是追求好奇心,BeaGo都能提供帮助。它通过AI生成的摘要快速提供清晰的答案,并且能够解读搜索内容中的图片,以视觉化的方式提供信息。此外,BeaGo还能学习用户的喜好,推荐新的话题,激发灵感。
bolt.new是一个集成了人工智能技术的开发者沙盒,旨在帮助开发者快速启动、运行、编辑和部署全栈Web应用程序。它提供了多种模板和框架,支持开发者使用他们喜欢的技术栈创建项目。
Open O1是一个开源项目,旨在通过开源创新,匹配专有的强大O1模型能力。该项目通过策划一组O1风格的思考数据,用于训练LLaMA和Qwen模型,赋予了这些较小模型更强大的长期推理和解决问题的能力。随着Open O1项目的推进,我们将继续推动大型语言模型的可能性,我们的愿景是创建一个不仅能够实现类似O1的性能,而且在测试时扩展性方面也处于领先地位的模型,使高级AI能力为所有人所用。通过社区驱动的开发和对道德实践的承诺,Open O1将成为AI进步的基石,确保技术的未来发展是开放的,并对所有人有益。