首页 > 业界 > 关键词  > Ovis最新资讯  > 正文

AI日报:​​阿里推新多模态大模型Ovis;Kyutai开源实时语音对话模型Moshi;Apple Intelligence测试版现已开放

2024-09-20 14:59 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里国际推出最新多模态大模型 Ovis,看菜品就能提供烹饪步骤

阿里国际AI团队发布了多模态大模型Ovis,为各行业带来新机遇。Ovis具备强大的图像理解和数据处理能力,可处理文本、图像等多种数据,表现出优秀综合实力。其在OpenCompass评测中获得综合排名第一,超越竞争者。Ovis采用Apache2.0开源协议,开发者可自由使用与改进。

image.png

【AiBase提要:】

🌟 Ovis是多模态大模型,处理文本和图像等多种数据,展现综合能力。

🚀 Ovis在OpenCompass评测中获得综合排名第一,超越竞争者。

🔓 Ovis采用Apache2.0开源协议,模型和代码在GitHub上公开,开发者可自由使用与改进。

2、革命性AI对话系统Moshi问世:机器也能说人话了?

在数字化时代,Kyutai实验室开发的全双工语音对话系统Moshi正在颠覆传统语音对话系统,实现更自然、更流畅的人机对话体验。Moshi结合文本语言模型、神经音频编解码器和多流音频语言模型,展现出卓越的性能表现。同时,Moshi注重安全性,确保系统不生成有害内容,保护用户隐私。这标志着人机互动方式的重大革新,展示了未来对话系统的无限可能。

【AiBase提要:】

🌟 Moshi是全双工语音对话系统,将对话视为语音到语音的生成过程,解决了传统语音对话系统的问题。

🔑 Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解码器和多流音频语言模型,实现了对话中的重叠、打断和插入语处理。

💡 Moshi具备内心独白功能,预测时间对齐文本令牌,提高语音生成质量,增强对话能力。

详情链接:https://huggingface.co/kyutai/moshiko-pytorch-bf16

3、Apple Intelligence测试版现已开放

苹果发布了 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的公开测试版,其中包括即将推出的 Apple Intelligence 功能,如文本重写工具、闪亮的新 Siri 设计、用于从照片中删除对象的“清理”工具等等。用户可通过苹果的测试版软件计划网站注册以获得测试资格,并在设备设置中下载安装测试版更新。新功能仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。

image.png

【AiBase提要:】

🔧 文本重写工具、新 Siri 设计、照片清理工具等功能即将推出。

📱 仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。

📅 苹果计划于10月发布 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的正式版本,用户可在正式版本发布后体验新功能。

4、机器人公司1X推出世界模型

1X Technologies推出的新生成模型在机器人系统训练中提高了效率,解决了学习"世界模型"的重要挑战。该模型能预测机器人动作对世界的影响,生成多种未来场景,预测复杂的物体互动。

image.png

【AiBase提要:】

🌟 世界模型是能够预测机器人行为与环境互动的虚拟模拟器。

🤖 通过真实数据学习,模型能够在数百万种场景中进行评估,增强了机器人智能。

💰 为推动研究,推出了1X 世界模型挑战赛,并提供奖金激励。

5、亚马逊推出一大波生成式 AI 工具,购物体验全面升级

亚马逊最近发布了一系列令人瞩目的生成式 AI 工具,旨在提升消费者和第三方卖家的购物体验。其中包括个性化产品推荐、免费 AI 视频生成工具以及聊天机器人“阿梅莉亚”,为用户和卖家带来更便捷的购物和营销体验。

image.png

【AiBase提要:】

🌟 个性化产品推荐,根据客户的搜索和购买历史提供个性化推荐。

🎥 免费 AI 视频生成工具助力卖家提升视频营销效果,满足消费者对品牌视频内容的需求。

🤖 聊天机器人“阿梅莉亚”提供个性化建议和业务分析,帮助卖家了解业务状况。

6、OpenAI将最新AI模型o1扩展到企业和教育领域

OpenAI推出最新AI模型o1-preview和o1-mini,专为处理复杂推理任务而设计,为企业和教育机构带来新的可能性。这些模型通过模拟人类思维过程,解决复杂问题,提供更严谨的思维方式。企业客户可获得巨大飞跃,将AI视为解决高风险问题的伙伴。教育领域也受益,学生和研究人员可以利用尖端AI工具解决难题。o1模型配备增强安全功能,保障客户数据安全。

【AiBase提要:】

🚀 o1-preview和o1-mini模型专为处理复杂推理任务而设计,模拟人类思维过程,解决难题。

💡 o1模型在回应之前花费更多时间处理信息,o1-preview在数学奥林匹克中解决83%问题。

💻 o1-mini模型专为编程任务设计,提供成本效益选择,适用于生成和调试复杂代码等任务。

7、OpenAI在新一轮融资据悉要求投资者至少出资2.5亿美元

OpenAI正在进行一轮巨额融资的后期谈判,其估值可能达到1500亿美元。据知情人士透露,该公司已要求投资者至少出资2.5亿美元。这表明该公司对这轮融资的需求非常迫切。

【AiBase提要:】

🔍 OpenAI估值或将达到1500亿美元

💰 投资者至少需出资2.5亿美元

🚀 新一轮融资将为OpenAI提供资金支持

8、Instagram宣布将用AI对新的青少年帐户进行年龄验证

Instagram最近宣布将通过人工智能技术对用户进行年龄验证,旨在更好地识别青少年用户,这一举措有望提升用户安全和隐私保护。

【AiBase提要:】

🌟 Instagram推出AI年龄验证,识别青少年用户。

🔒 Yoti合作验证年龄,96%虚报用户被阻止。

🚨 政府可能介入,实施强制措施如果AI效果不佳。

9、OpenAI招募机器学习工程师,开拓多智能体研究新领域

OpenAI最近宣布招募机器学习工程师,成立多智能体研究团队,旨在提升AI推理能力。新推出的o1模型需要用户适应时间,但在科学和数学领域表现出色。

【AiBase提要:】

🔍 OpenAI正在招募机器学习工程师,组建新的多智能体研究团队。

🚀 新推出的o1模型旨在提升AI的推理能力,用户需时间适应。

🏆 o1系列模型在科学和数学领域表现出色,解决复杂问题的能力显著增强。

10、英特尔AI加速器Gaudi3下周发布,挑战NVIDIA统治地位!

英特尔即将发布Gaudi3AI加速器,旨在挑战NVIDIA在AI芯片市场的统治地位。该加速器被称为AI英雄,具备高能效和快速运算能力,预计将超越NVIDIA的H100GPU。英特尔在2024年计划中稳步推进,展望2025年推出的Falcon Shores将进一步提升其在AI领域的竞争力。

【AiBase提要:】

🌟 Gaudi3加速器具备高能效和快速运算能力,预计超越NVIDIA H100GPU。

⚡️ 英特尔声称Gaudi3的能效是前代产品的两倍,将挑战NVIDIA的统治地位。

🚀 展望2025年,Falcon Shores将结合AI能力与强大GPU,增添英特尔在市场上的竞争优势。

举报

  • 相关推荐
  • GOOVIS 移动大屏,畅享5G时代手机“清新视界”

    手机屏幕大屏化成为趋势,但物理尺寸遇瓶颈时至今日,越来越多的手机厂商开始注重大屏手机,市场主流旗舰手机基本都在6. 0 英寸以上,有的甚至接近平板大小。例如华为Mate20 X 7. 2 吋屏幕,iPhone 11 Pro 6. 5 吋屏幕,甚至有华为5G手机Mate X 的折叠屏幕完全展开后为 8 寸、合起来正面是一块6. 6 寸大屏、背面屏幕尺寸为6. 38 寸……但这并不意味着大屏手机会一直“变大”下去。因为人的大拇指长度决定了手机屏幕的可操作范围,?

  • 视界从此不同 GOOVIS智能眼镜惊艳高交会

    2017年11月16日,持续6天的2017年中国国际高新技术成果交易会(简称“高交会”)在深圳会展中心开幕。作为目前中国规模最大、最具影响力的科技类展会,高交会有着“中国科技第一展”之称。展会上重点展示了节能环保、新一代信息技术、生物、高端装备制造、新能源、新材料、新能源汽车等领域先进技术和产品。1号馆作为历届高交会的核心展示区,本届的展示内容聚焦在了VR/AR、智能AI领域。作为国内知名科技创新型公司,也是全球近眼?

  • “Boviste音响”自媒体社会领域排名,自媒体新手该怎么入门?

    备注:本文数据来自站长之家移动传媒平台,文章涉及的数据依托平台大数据计算所得,非百度官方数据,仅供参考。Boviste音响是当前百家号中的普通号,目前账号百家号权重为2,综合排名位列796112名,社会分类排名位列82213名,领先了28.4%的百家号。 Boviste音响百家号概况 Boviste音响的简介为数字广播系统和会议系统解决方案提供商,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过16篇的游戏内

  • 在线视频实例分割技术TCOVIS 可保持时间一致性

    研究人员介绍了一种名为TCOVIS的在线视频实例分割技术,该技术注重时间一致性。实例分割是计算机视觉领域的一个热门研究课题,其目标是将视频帧中的每个独立实例进行识别和分割。该框架可以部署在资源受限的边缘设备上,实现实时高质量的视频实例分割。

  • 电子显示屏伤眼怎么破?GOOVIS护眼显示器呵护眼健康

    2020 年 6 月 6 日是我国第 25 个爱眼日。今年爱眼日主题是“视觉2020,关注普遍的眼健康”。然而,现代人身处被电视、电脑、手机、平板等各种电子屏包围之中,学习、办公、观影、追剧、游戏……每天数小时面对各种电子显示屏,用眼负荷及频率大大增加,不可避免会引起眼睛干涩、酸痛、不舒服等视疲劳现象,甚至导致近视度数不断加深,及引发各种眼健康隐患。现代人想爱眼、护眼谈何容易! 幸运的是,GOOVIS护眼显示器,着眼于护眼

  • 特斯拉与现代Glovis签订一年合同:将负责运送上海工厂出口的汽车

    据悉,特斯拉跟韩国物流公司现代Glovis签署了一份为期一年、价值4.22亿美元的合同。后者将负责将特斯拉在中国超级工厂生产的车辆运送到其他地区。特斯拉在2021年的大部分时间里,一直将上海超级工厂作为其车辆的出口中心。今年之前,特斯拉坚持认为,它不会将上海生产的车辆作为其他市场的补充库存。然而,这家公司在新年伊始改变了对这一想法的立场并开始了其出口计划,其直接从上海向欧洲运送7000辆Model 3。这成为了众多从中国?

  • GOOVIS成为全球首个获得SGS “元宇宙系列·低疲劳认证”的VR头显

    本月,头戴影院领导品牌GOOVIS成功获得全球首张SGS“元宇宙系列·低疲劳认证”,并同时通过了SGS低蓝光认证,被评判为低蓝光“出色”等级。这是继GOOVIS获得全球首个德国莱茵TUV“全模式低蓝光”头显的认证后,再一次获国际权威机构认可。这意味着GOOVIS在视觉健康方面已处于同业领先水平,作为头戴影院标杆品牌,再一次树立新高度!作为全球第一个获得该认证的品牌,GOOVIS在第四届进博会SGS的“明星展区”——XR 光学测试系统展?

  • “超出预期” GOOVIS G3 Max首次内测获用户力赞

    GOOVIS在深圳举办其最 新品的用户内测活动,邀请了GOOVIS4年以上资 深用户抢先体验最 新旗舰款高清头显GOOVIS G3Max...另一位资 深用户唐先生对G3Max的表现也十分满意...在有限空间和状态下,GOOVIS带给了用户巨屏享受...相比现有GOOVIS产品,GOOVIS G3Max在屏幕、光学系统、色彩管理、3D算法、人体工学、屈光度调节系统、视听系统、外观ID、感知与操作等九大方面全面突破,再获极限提升,或将成为高清头显标杆之作......

  • 护眼显示器不知怎么选?来看看这款新锐产品——GOOVIS护眼头显

    根据中国互联网络信息中心最新发布的《中国互联网络发展状况统计报告》显示,截至 2021 年 6 月,我国网民规模达10. 11 亿,互联网普及率达71.6%...减少近距离用眼,尤其减少持续的近距离用眼时间可预防近视的发生和发展...2、高能可见蓝光危害人眼......

  • 公告:NOVIS诺维斯痛风宝系列产品进驻京东国际 正式与大众见面

    数家海外媒体报道了这一项文学军教授新技术突破成果——诺维斯痛风宝, 其核心成份能够调节嘌呤正常代谢,抑制尿酸形成,溶解痛风结晶,加速尿酸排泄!创新的降尿酸黄金配方结合强大的天然草本精华和氨基酸、维生素和矿物质营养配方,有效降低尿酸和缓解痛风缠扰...在国内市场,随着中国未来的人口增长趋势和患病率的升高,预计我国高尿酸血症及痛风患病人数会在2030年达到2.4亿人...想要达到这些目的,离不开专业、规范化的治疗,而诺维斯痛风宝中小分子肽具有溶解尿酸结晶,促进体内尿酸排出,维持健康尿酸水平和缓解痛风症状作用......

今日大家都在搜的词: