首页 > 业界 > 关键词  > 豆包最新资讯  > 正文

AI日报:豆包推出Ola Friend智能体耳机;vivo发布全新蓝心大模型矩阵;开源版NotebookLM来了

2024-10-10 14:59 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、豆包推出Ola Friend智能体耳机:售价1199元

豆包推出Ola Friend智能体耳机,这款集成了人工智能技术的耳机旨在为用户提供一个随时陪伴在耳边的AI朋友。用户可以享受听音乐、学习英语、获取导游服务等多种功能,需要下载豆包APP来充分利用。

image.png

【AiBase提要:】

🎧 Ola Friend智能体耳机售价1199元,支持智能对话功能。

🤖 Ola Friend耳机是随时陪伴在耳边的AI朋友,提供听音乐、学习英语、导游服务等功能。

📱 用户需下载豆包APP来充分利用Ola Friend耳机的功能,APP支持搜索信息、答疑解惑、激发灵感等多种功能。

2、vivo发布全新蓝心大模型矩阵

vivo在2024vivo开发者大会上发布了全新蓝心大模型矩阵,升级了语言、语音、图像和多模态能力,提供更强大的性能和功能。新的蓝心大模型矩阵将行业标准提升至新高度,为用户带来更优质的体验。

【AiBase提要:】

🚀 蓝心大模型矩阵全面升级,包括语言、端侧、语音、图像和多模态大模型。

💡 推出30亿蓝心端侧大模型3B,性能提升300%,功耗优化46%,内存减小63%,出词速度达80字/s。

🔊 新自研蓝心语音大模型支持自然语义理解、情感表达和同声传译,图像&多模态大模型强化中国特色与东方美学融合生成能力。

3、开源版NotebookLM来了!Podcastfy:输入PDF、文本、网址等即可转换成播客

在数字时代,制作引人入胜的多语言音频内容成为热门话题。谷歌的NotebookLM备受好评,而开源Python软件包Podcastfy引起广泛关注。Podcastfy是开源版NotebookLM,采用先进的生成式人工智能技术,让用户实现更多个性化和规模化的播客制作。

【AiBase提要:】

🌟 Podcastfy是开源Python软件包,可将文本和网络内容转换为多语言音频对话。

🎧 用户可以通过Gradio演示应用或HuggingFace体验Podcastfy,操作简单易上手。

⚠️ 使用外部内容时,需确保拥有版权和权限,生成的音频内容由AI生成,不模仿现实人物。

详情链接:https://github.com/souzatharsis/podcastfy-demo?tab=readme-ov-file

4、图像修复新魔法!突破性算法PMRF

PMRF(后验均值修正流)算法是图像处理领域的一项创新技术,解决了图像恢复中失真与感知质量之间的矛盾,开辟了高质量图像重建的新可能。其独特之处在于在多种图像恢复任务中展现卓越性能,取得了令人瞩目的成绩,平衡了失真和感知质量。

【AiBase提要:】

✨ PMRF算法巧妙结合后验均值预测和修正流模型,创造全新图像恢复框架,最大程度减少失真,提升感知质量。

🌟 应用广泛,涵盖去噪、超分辨率、修复受损区域和颜色恢复等多个方面,生成自然真实图像。

💡 在基准和真实数据集测试中,PMRF表现优异,平衡失真和感知质量,树立新的图像恢复标准。

详情链接:https://huggingface.co/spaces/ohayonguy/PMRF

5、沃尔玛推出新型人工智能模型 Wallaby

沃尔玛最近推出了名为Wallaby的大型语言模型,专注于零售行业数据,旨在提升客户服务体验。他们采用多模型组合的方法,灵活应对不同应用需求。升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。

【AiBase提要:】

✨ 沃尔玛推出 Wallaby 大型语言模型,专注于零售行业数据,旨在提升客户服务体验。

🤖 沃尔玛采用多模型组合的方法,灵活应对不同应用需求。

🛍️ 升级后的客户支持助手能够更精准地理解客户意图,提供个性化服务。

6、夸张!GPT-4无意中掌握面部识别技术,准确率超越专业算法

最近的研究显示,GPT-4具备了面部识别、性别判断和年龄估算能力,准确率超越专业算法,但存在安全隐患。研究揭示了绕过GPT-4安全机制的方法,引发了对大型语言模型安全性的思考。尽管GPT-4在生物识别任务表现出色,研究作者警告不能完全依赖其识别能力。

【AiBase提要:】

🌟 GPT-4在性别识别测试中达到了100%的完美准确率,超越了DeepFace模型。

📊 GPT-4的年龄估算准确率为74.25%,但对年长者的估算可能较宽泛。

🔒 研究发现可绕过GPT-4的安全机制,需加强对大型语言模型安全性的研究。

7、200万用户量!Hugging Face旗下Gradio5发布:用自然语言轻松构建AI应用

Hugging Face旗下Gradio5发布,致力于简化AI开发,提供企业级安全性和AI Playground功能,进一步推动AI应用开发体验。

image.png

【AiBase提要:】

🌟 Gradio5引入企业级安全性,确保应用安全无忧。

🚀 新增的AI Playground功能,简化开发流程,让生成应用变得轻松。

🔮 Hugging Face规划未来,推出多种新功能,进一步提升AI应用开发体验。

详情链接:https://www.gradio.app/

8、OpenAI 申请法庭驳回马斯克诉讼,称其为 “骚扰” 行为

在这篇文章中,OpenAI向法庭申请驳回马斯克对公司的诉讼,称其为“骚扰”行为。文章揭示了马斯克和OpenAI之间的法律纠纷背景,强调马斯克的指控缺乏证据,并质疑他的法律地位。

【AiBase提要:】

🌟 马斯克对 OpenAI 的多项诉讼被 OpenAI 称为 “骚扰”,并申请驳回。

📉 OpenAI 强调马斯克的指控缺乏证据,称其为不切实际的主张。

⚖️ 马斯克声称 OpenAI 未遵循创始协议的承诺,但法律上被质疑无权提出此类指控。

9、Zoom推数字分身功能:便利还是隐忧?

Zoom计划推出数字分身功能引发了人们对于深度伪造技术的担忧。虽然这项功能能提高视频创作效率,但也可能带来虚假信息传播的风险。

【AiBase提要:】

✨ Zoom计划推出数字分身功能,将用户视频转化为AI驱动的逼真数字化身,提高异步交流效率。

💡 深度伪造技术的普及使得区分真相和虚假信息变得困难,可能导致虚假视频的滥用。

🔒 Zoom对安全措施描述模糊,仍需加强保护措施以防止恶意虚假视频的生成。

10、DressRecon:输入视频就能构建出还原服装细节的3D模型

近日,卡内基梅隆大学的研究团队发布了名为“DressRecon”的新技术,通过单目视频实现高质量的人体重建,尤其适用于宽松衣物和手持物体的场景。该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识捕捉细微几何特征。重建结果生成高保真的三维模型,支持从任意角度渲染,提升了可视化体验。

image.png

【AiBase提要:】

👗 研究团队推出DressRecon技术,通过单目视频实现高质量的人体重建,特别适用于宽松衣物和手持物体的场景。

📷 该技术利用神经隐式模型将身体与衣物变形分开处理,借助图像基础的先验知识来捕捉细微几何特征。

🎥 重建结果不仅生成高保真的三维模型,还支持从任意角度渲染,提升了可视化体验。

详情链接:https://jefftan969.github.io/dressrecon/

11、DreamWaltz-G:从文本生成生动的3D 可动画头像

在数字化时代,个性化的虚拟形象受到关注。DreamWaltz-G框架通过结合骨骼引导的得分蒸馏和混合3D高斯表示,提升了头像生成的一致性和动画表现力。该框架支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。

image.png

【AiBase提要:】

📌 创新框架DreamWaltz-G能根据文本描述生成生动的3D可动画头像。

🎨 结合骨骼引导的得分蒸馏和混合3D高斯表示,提升头像生成的一致性和动画表现力。

🎥 支持形状控制、视频重演和多主体场景构建,拓展了数字内容创作的可能性。

举报

  • 相关推荐
  • 抖音副总裁李亮评价豆包手机:中兴和豆包的探索是一个开始

    日前,豆包手机引发业内关注与网友热议。 今日,抖音副总裁李亮发文称:AI带来的变革是真实存在的,用户的需求也是真实存在的。” 他表示,豆包和中兴的探索是一个开始,不论这次是不是会成功,但AI一定是未来。

  • 豆包手机助手发声:无法截屏银行键盘等受保护内容

    豆包手机助手官方回应称,其技术实现方式被误解。该助手采用原生截图接口,严格遵循应用声明的Secure标记,无法截取银行安全键盘等受保护界面内容。用户可自行测试验证。助手使用READ_FRAME_BUFFER权限是为在虚拟屏中获取应用截图内容供豆包大模型推理,但该权限无法读取任何标记为Secure的内容。CAPTURE_SECURE_VIDEO_OUTPUT权限用于在虚拟屏投影中正常显示受保护界面使用户可操作,但投影后该界面仍标记为Secure,仅可被用户查看,无法被截图。助手仅在用户指令时开始截图,且截图仅用于视觉理解和推理,完成任务后不会存储在云端。

  • 豆包“输入”微信里

    ​几天前,豆包又推出了一款新产品——豆包输入法。 输入法是古老的工具型产品。在移动端,用户早已习惯了使用手机自带的输入法,或是沿袭PC时代的习惯,使用搜狗输入法、QQ输入法等。 直到2022年微信输入法横空出世,这块稳得不能再稳的市场才迎来新的变量。凭借微信的庞大用户池,微信输入法很快成为许多用户的新选择。 但如前所述,微信对于输入法似乎兴趣不

  • 豆包手机掀起了滔天巨浪

    十八年前,苹果凭借一款iPhone,将手机带入了一个由独立APP组成的智能时代,建立起了沿袭至今的“围墙花园”生态。十八年后,软件生态变革信号再次响起,但这一次,战火的引燃者并非硬件巨头,而是试图改写软件秩序的新一代互联网大厂。 12月1日,字节跳动联合中兴通讯推出的“豆包手机”——nubia M153,在整个科技圈掀起了巨浪。这款在系统中深度嵌入豆包手机助手�

  • 对标豆包!微信输入法iOS版3.0开启内测:支持方言语音输入

    微信输入法自上线以来,凭借无广告、界面简洁、支持PC联动等特点获得良好口碑。近期,豆包输入法正式上线,给微信团队带来竞争压力。目前iOS微信输入法已开启3.0版本内测,主要升级了语音输入体验,包括模型升级、支持更多方言和英文识别、超长语音记录及待机时长功能。新版本语音识别准确度高,甚至能自动标注标点。不过,多数用户仍不习惯语音输入,对于习惯打字的用户而言,此次升级体验变化不大。

  • 李楠:豆包手机是今年技术最激进的AI设备

    怒喵科技创始人李楠发文表示,豆包手机是今年技术上最激进的AI设备。 自从豆包手机上架以来,市场给予了近乎狂热的反馈,该机定价是3499元,一经上市便被抢购一空,二手平台炒至8000元以上,这款AI设备由字节跳动旗下的豆包团队和努比亚联合打造。 你只需发出语音指令,豆包手机上的AI助手就能自动在屏幕上点击、滑动,跨越App的边界,完成点外卖、比价等一系列操�

  • 豆包手机助手把大厂们架在了火上烤

    这是《窄播Weekly》的第74期,本期我们关注的商业动态是:豆包手机助手的推出,拉高了用户对通用Agent的期待,也加剧了互联网大厂和手机厂商围绕AI时代的超级入口进行的竞争。 本周,豆包手机助手的发布在行业内外都掀起了轩然大波。 首先,豆包手机助手虽然强调自己是一个应用,但其代理用户执行任务的能力却高度依赖与中兴深度合作的nubia M153豆包手机助手技术预览�

  • 罗永浩点赞豆包手机 称AI助手一定会遍地开花

    罗永浩发文支持豆包手机,称技术革命不可阻挡,无论大小应用或国家都无法阻拦。他赞扬字节跳动迈出第一步的勇气,并相信AI助手未来将如繁花般普及,成为生活不可或缺的一部分。此外,豆包手机系统软件中出现锤子科技遗留字样及经典铃声,引发网友猜测与讨论。

  • 倪飞让豆包手机接管微博评论区:自动回复网友提问

    自从豆包手机上架以来,豆包手机助手成为科技圈最为关注的热点话题。 对比其它手机,豆包手机最大的区别是提供了系统级服务,用户只需动嘴,豆包手机助手就能指挥手机去执行那些原本需要点击几十次屏幕的繁琐操作,比如跨平台比价、点外卖等等。

  • 豆包输入法iOS版迎来首次更新!优化耗电、语音输入更方便了

    日前,豆包输入法iOS版迎来发布后的首次更新,最新版本升级至0.8.1。 本次更新重点优化了耗电表现、设置首页样式,并新增语音输入后的修改推荐功能,同时修复了多项已知问题,整体体验进一步完善。

今日大家都在搜的词: