首页 > 业界 > 关键词  > 微软最新资讯  > 正文

AI日报:微软发布iPhone可运行AI模型;全国首例AI声音侵权案判了;Kimi创始人套现数千万美金;中文聊天模型Llama3发布

2024-04-23 15:57 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯SaaS产品智能化升级 全面接入混元模型

腾讯宣布旗下协作SaaS产品全面接入混元模型,实现软件服务智能化。腾讯乐享、腾讯电子签、腾讯问卷等产品已实现智能化升级,为用户提供更智能、高效的服务。混元大模型已扩展至万亿级参数规模,在国内率先采用混合专家模型结构,性能表现优异。外部开发者和企业可以通过腾讯云上API直接调用腾讯混元能力,解决用户痛点。

【AiBase提要:】

🚀 腾讯SaaS产品实现智能化升级,提供更智能、高效的服务。

💡 混元大模型扩展至万亿级参数规模,性能在多方面表现优异。

🔗 外部开发者和企业可通过腾讯云API调用混元能力,解决不同场景下的痛点。

2、微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位

微软最新推出的Phi-3系列小型AI模型在AI领域引起轰动,尤其是Phi-3-mini模型在多项基准测试中超越了参数更大的Llama3模型。该系列模型能在iPhone14Pro和iPhone15上实现每秒12token的运行速度,达到了ChatGPT水平。微软强调训练数据的重要性,通过精心设计数据和训练方法提升模型性能。

image.png

【AiBase提要:】

🚀 Phi-3-mini模型参数仅3.8B,性能超越8B参数的Llama3模型。

💡 Phi-3系列包括Phi-3-small和Phi-3-medium版本,性能优越。

🔍 微软团队通过精心设计训练数据和独特训练方法提升了Phi-3系列模型的性能。

详情链接:https://arxiv.org/pdf/2404.14219.pdf

3、全国首例AI声音侵权案一审宣判 自己声音被AI化出售获赔25万元

这篇文章报道了全国首例AI声音侵权案的一审判决结果,涉及配音师声音被AI技术滥用的案件引起社会广泛关注。法院裁定被告未经授权擅自使用配音师声音开发AI产品构成侵权,需赔偿25万元。判决强调声音作为人格权益应受法律保护,为声音创作者提供了重要法律保障。

【AiBase提要:】

🔍 首例AI声音侵权案一审判决结果:被告未经授权使用配音师声音开发AI产品,需赔偿25万元。

💡 法院强调声音作为独特人格权益应受法律保护,未经授权擅自使用声音构成侵权行为。

👩‍⚖️ 判决为声音创作者提供了重要法律保障,将坚决维护声音权益并打击侵权行为。

4、中文聊天模型Llama3-8B-Chinese-Chat发布

这篇文章介绍了基于Meta-Llama-3-8B-Instruct模型经过ORPO方法微调的中文聊天模型Llama3-8B-Chinese-Chat。该模型减少了中英混合回答和表情符号的使用,使得回答更正式和专业。它在理解中文问题意图、提供恰当回答、拒绝不当请求等方面表现出色。

【AiBase提要:】

🔑 Llama3-8B-Chinese-Chat是基于Meta-Llama-3-8B-Instruct模型通过ORPO方法微调的中文聊天模型,减少了中英混合回答和表情符号的使用。

🌟 ORPO方法利用赔率比概念调整模型偏好设置,优化模型在特定任务中的表现,Llama3-8B-Chinese-Chat模型使用ORPO优化中英文生成偏好。

💡 Llama3-8B-Chinese-Chat模型在安全、道德、数学问题解答、写作和编程示例等方面表现出色,提供更准确、专业的回答和示例代码。

详情链接:https://top.aibase.com/tool/llama3-8b-chinese-chat

5、Adobe发布视频超分辨率项目VideoGigaGAN

Adobe最近推出了视频超分辨率项目VideoGigaGAN,该项目在视频放大技术方面取得了显著进展,能将视频放大至原始分辨率的8倍,保持时间连贯性和高频细节清晰度。这一技术将视频处理带入新阶段,极大扩展了视频内容的应用范围和质量。

image.png

【AiBase提要:】

✨ VideoGigaGAN实现视频放大至8倍原始分辨率,保持时间连贯性和高频细节清晰度。

🔍 Adobe优化GigaGAN模型,增强视频稳定性,展示卓越性能。

💡 VideoGigaGAN提升视频视觉质量,适应不同风格视频内容,具有广泛的应用潜力。

详情链接:https://top.aibase.com/tool/videogigagan

6、Midjourney发布random功能 可基于提示词生成完全随机的图像风格

Midjourney发布了一个有趣的功能,可以基于提示词生成完全随机的图像风格。用户可以通过随机生成的图像风格来探索不同的创作方向,同时还可以与其他用户进行实时交流和分享,共同探讨创作过程中的灵感和想法。这一功能的推出将进一步丰富用户的图像生成体验,为他们提供更多的创作选择和交流平台。

image.png

【AiBase提要:】

⚙️ 可基于提示词生成完全随机的图像风格

💬 用户可以通过Room功能进行实时交流和分享

🎨 探索不同的创作方向,丰富用户的图像生成体验

7、AI独角兽月之暗面创始人杨植麟套现数千万美金 官方回应

杨植麟作为月之暗面创始人,通过个人股份销售套现数千万美元,引起广泛关注。公司成立仅一年便获得巨额融资,估值超过25亿美元。月之暗面的成功不仅在估值上体现,旗舰产品Kimi Chat的成功也备受瞩目。

【AiBase提要:】

🚀 月之暗面创始人杨植麟通过个人股份销售套现数千万美元,公司估值超过25亿美元。

💡 月之暗面创立仅一年便迅速崛起,成为中国大模型领域独角兽之一。

💬 月之暗面旗舰产品Kimi Chat凭借“长文本”功能在AI大模型领域脱颖而出,引发资本市场热潮。

8、毫不犹豫!小扎自曝愿开源100亿美元模型 直言2025年之前AGI不可能实现

最新的播客访谈中,小扎展现了开源英雄形象,表示愿意开源价值100亿美元模型,强调开源降低成本促进创新,但也需综合考虑经济利弊。他对2025年之前AGI实现持悲观态度,认为能源短缺是瓶颈,解决可能需数十年。批评苹果和谷歌独占移动生态,希望通过开源改变局面,防范竞争对手威胁。对于人工智能发展瓶颈,担忧能源限制和数据中心挑战,持保留态度未来AI模型能力提升。

【AiBase提要:】

💡 小扎愿意开源价值100亿美元模型,认为开源降低成本促进创新,但需综合考虑经济利弊。

💡 对2025年之前AGI实现持悲观态度,认为能源短缺是瓶颈,解决可能需数十年。

💡 批评苹果和谷歌独占移动生态,希望通过开源改变局面,防范竞争对手威胁。

9、字节跳动发布图像模型蒸馏算法Hyper-SD

这篇文章介绍了字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,该算法在图像处理和机器学习领域取得重要进展。通过创新的方法提升了模型性能,在保持模型精简的同时提高了推理速度和效率。

image.png

【AiBase提要:】

⚙️ 分段轨迹一致性蒸馏:Hyper-SD技术确保了原始ODE轨迹的完整性。

🧠 人类反馈学习机制:引入人类反馈学习,提升模型表现,减少性能损失。

🔬 分数蒸馏技术:增强了模型在低步推理下的生成能力,进一步提升性能。

详情链接:https://top.aibase.com/tool/hyper-sd

10、AI音乐生成工具AI Jukebox 输入提示词选择曲风即可创作音乐

AI Jukebox是一款利用人工智能技术的音乐生成工具,通过Hugging Face平台提供服务。它简化音乐创作过程,智能化且用户友好。用户可以通过输入提示词指导AI生成特定风格音乐,实现智能化音乐创作。AI Jukebox鼓励人机合作模式,为音乐人和音乐爱好者提供灵感和创作工具,探索无限可能性。

image.png

【AiBase提要:】

🎵 本地化模型加载: 用户打开AI Jukebox的网页后,系统自动加载生成模型,无需复杂设置。

🎶 基于提示词的音乐生成: 用户通过输入特定提示词指导AI生成特定风格音乐,包括音乐类型、情感、乐器等描述。

🎼 人机合作模式: AI Jukebox鼓励用户与AI合作,探索新的音乐创作方式,提供灵感和创作工具。

详情链接:https://top.aibase.com/tool/ai-jukebox

11、虚拟人聊天系统Live2D

这篇文章介绍了基于Unity开发的Live2D虚拟人聊天系统项目,利用Live2D技术展现动态虚拟人形象,提供流畅的动画效果,增强用户交互体验。项目集成了Azure、OpenAI和APISpace等API支持自然语言处理和生成,实现实时文本交流。同时支持图像处理和人脸检测,高清分辨率显示,以及自定义扩展功能。

image.png

【AiBase提要:】

👩‍💻 Live2D虚拟人形象集成,提供流畅的动画效果,增强用户体验。

💬 实时聊天功能,虚拟人能理解并回应用户文本输入,实现实时交流。

🔍 图像处理和人脸检测,让虚拟人更好地响应用户视觉输入。

详情链接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity

12、港大与浙大联合研发SC-GS模型

本文介绍了香港大学CVMI实验室与3D大模型公司VAST以及浙江大学联合研究团队提出的SC-GS模型,该模型在数字资产创造和3D重建领域取得突破性成果。通过稀疏控制点实时交互编辑,实现了对动态场景的高效编辑和合成,展现了巨大潜力。

image.png

【AiBase提要:】

🌟 SC-GS模型在新视角合成领域掀起革命性浪潮,展现出对动态高斯的稀疏控制点进行实时交互编辑的能力。

🔑 用户可以通过简单的鼠标拖拽和键盘组合按键操作,轻松实现对重建动态场景的编辑。

💡 SC-GS模型通过神经网络预测控制点运动状态,驱动整个场景中的动态高斯进行变形,提升了动态新视角合成的性能。

详情链接:https://top.aibase.com/tool/sc-gs

13、新视频分割技术SAM 可高效识别移动物体

本文介绍了在视频分割领域,研究团队探索新的视频对象分割技术,通过结合SAM模型和光流技术,提高了视频分割性能。两种模型展示了潜力,实现了显著性能提升,并将分割技术扩展到整个视频序列,实现物体追踪。这些技术提升了视频分割精度和效率,降低了计算复杂度,对多个应用场景具有重要意义。

image.png

【AiBase提要:】

⚙️ SAM与光流结合的模型展示了提高视频分割性能的潜力。

🔍 SAM与RGB图像结合的模型增强了模型对视频中物体运动的识别和分割能力。

🚀 将基于帧的分割方法扩展到整个视频序列,实现了物体在视频连续帧中的身份追踪。

详情链接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/

举报

  • 相关推荐
  • 大家在看
  • 万彩商图:快速更换商品图片背景,提升商品展示效果。

    万彩商图是一个在线设计工具,专注于帮助用户快速更换商品图片的背景,以提升商品的视觉效果和吸引力。它利用AI技术实现一键式操作,简化了传统图片编辑的复杂流程,使非专业用户也能轻松制作出专业的商品展示图。

  • AIEmoji:快速找到适合你情感的Emoji表情。

    AIEmoji是一个基于人工智能技术的Emoji搜索网站,它允许用户通过自然语言描述来搜索和找到匹配的Emoji表情。这项技术简化了Emoji的搜索过程,提高了用户在社交、写作和其他需要表情符号的场合的效率和表达能力。

  • Brev.ai:AI音乐生成器,几秒钟创作高质量音乐。

    Brev.ai是一款利用人工智能技术,根据用户输入的文本描述快速生成独特音乐作品的在线音乐创作工具。它基于Suno V3.5技术,支持多种音乐风格和流派,适用于视频、播客、游戏配乐等多场景。Brev.ai的主要优点包括高效率、成本效益高、易于使用,以及能够提供高质量的音乐输出。

  • 知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

    知了 zKnown 是一款 AI-Native 构建的个人知识助手,专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能,帮助用户高效地管理和整理信息。产品的主要优点包括:- 多端同步:用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结:支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持:最长支持总结3万字的文章内容。- 摘要导出:用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景:知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率,适合需要高效处理大量信息的用户。

  • MBox AI Meet:实时转录与会议总结的谷歌会议扩展

    MBox AI Meet是一款免费Chrome扩展,专为Google Meet设计,提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论,而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节,并在会议结束后自动生成总结,确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全,不存储任何音频或视频内容。此外,该扩展还计划在未来更新中增加更多AI功能,如发言人识别、实时AI助手等。

  • Klee:本地安全AI,保障数据隐私。

    Klee是一款macOS原生的AI助手应用程序,专注于本地处理数据,确保数据安全和隐私。它使用先进的AI技术,如RAG(检索增强生成)和开源大型语言模型,如Llama 3和Mistral,为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

  • Kipps.AI:快速构建AI助手,提升业务效率

    Kipps.AI 是一个在线平台,允许用户在短短两分钟内构建自己的AI助手,并将其集成到业务中。该平台支持多种数据源,如PDF、Notion、网站链接和文本,用户只需提供这些数据,Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成,使得用户可以轻松地将AI助手集成到现有的业务流程中。

  • CrossPrism for MacOS:图像识别、标注和关键词生成工具

    CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎,能够识别物种、生成标题和描述,并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片,确保所有照片安全地存储在 Mac 上,无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类,并提供新的视角来整理目录和重新发现旧照片。此外,它还支持视频处理、Lightroom 插件、图像质量评估等功能,使其成为一个强大的筛选工具。

  • ZETIC.ai:构建零成本的设备端AI。

    ZETIC.ai提供了一种革命性的设备端AI解决方案,使用NPU技术帮助企业减少对GPU服务器和AI云服务的依赖,从而显著降低成本。它支持任何操作系统、任何处理器和任何目标设备,确保AI模型在转换过程中不损失任何核心功能,同时实现最优性能和最大能效。此外,它还增强了数据安全性,因为数据在设备内部处理,避免了外部泄露的风险。

  • Kerqu.Ai:一站式AI内容生成器,助力跨境电商提升效率。

    Kerqu.Ai是一个为跨境电商卖家提供一站式AI解决方案的平台,整合了先进的AI技术,帮助用户节约成本、提升品牌影响力和销售转化率。产品通过AI技术实现模特换场景、AI图片创作、批量抠图、图片变高清等功能,同时提供一键撰写文案、优化文案和多语言翻译服务,满足多站点经营需求。

  • ReviewHawk:通过分析用户评论,降低用户流失率。

    ReviewHawk是一个专注于分析应用商店评论的工具,旨在帮助企业降低用户流失率,获取用户反馈,从而改善产品。它通过数据驱动的决策和用户满意度分析,帮助企业了解用户真正想要的功能,从而提升用户留存率和产品满意度。

  • Airtable Cobuilder:快速创建与管理数据的应用程序

    Airtable Cobuilder 是一款强大的应用程序构建工具,旨在通过简单的拖放界面和AI辅助功能,帮助用户快速创建和管理数据。它允许用户连接和简化他们最关键的数据,通过可视化数据、自定义视图和集成其他业务工具,提高团队协作和数据管理的效率。该工具特别适合需要高度定制化和灵活性的业务应用场景。

  • Alertfor:追踪网络信息,及时获取答案变化

    Alertfor 是一个在线平台,通过其专有的AQTA (Ask Question Track Answer) 流程,允许用户提交复杂问题,并在网页上寻找最相关的答案。它通过持续追踪提供连续的更新,确保用户能够获得准确且及时的信息。

  • Unskool:家长支持工具,助力家庭教育

    Unskool是一个由家长为家长制作的辅助工具,旨在简化家庭教育过程。它通过去除繁琐的行政工作,让家长能够专注于创造一个丰富的学习环境,让家长和孩子都能茁壮成长。Unskool提供了跟踪、记录和灵感激发的功能,并通过人工智能生成定制的、按需的课程计划,帮助家长更高效地进行家庭教育。

  • AI Generated Diagram:智能生成图表工具

    AI Generated Diagram 是一款利用人工智能技术生成图表的工具。它通过用户输入的提示(prompts)来创建图表,支持多种布局类型,如水平布局(Horizontal)。用户可以通过编辑、配置等操作来调整图表的细节,并支持导出为SVG格式或导出数据。该工具不仅提高了设计图表的效率,还通过AI技术提升了图表的美观度和准确性。

  • Free AI Image Extender:使用人工智能扩展图像边界

    AI Image Extender 是一款利用人工智能技术扩展图像边界的工具,通过生成新内容与现有图像无缝融合,增强图像的视觉延展性。该产品通过先进的AI算法,能够智能识别图像内容并生成自然过渡的扩展区域,适用于需要图像扩展或背景生成的各种场景。

  • Capacities:一个为你的思维打造工作室的APP

    Capacities是一个旨在改善人们思考方式和工作流程的应用程序。它通过使用对象而非传统文件和文件夹来组织信息,帮助用户更直观地理解和连接复杂的信息结构。该应用支持网络化笔记,使用户能够自然地构建信息网络,激发新的创意。Capacities还提供AI助手,帮助用户与笔记中的对象动态互动,并提高写作质量。此外,该应用注重数据安全和隐私保护,符合GDPR标准,数据存储在欧盟的加密服务器上。

  • CLASI:高质量、类人同声传译系统

    CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟,采用多模态检索模块来增强特定领域术语的翻译,利用大型语言模型(LLMs)生成容错翻译,考虑输入音频、历史上下文和检索信息。在真实世界场景中,CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例(VIP),远超其他系统。

  • image-matting:AI抠图项目,使用开源模型实现图像抠图。

    image-matting 是一个基于开源模型 briaai/RMBG-1.4 的AI抠图项目。该项目旨在通过学习AI技术、GUI开发、前端学习以及i18n国际化等技术,实现本地模型算法的图像抠图功能。它支持单张和批量抠图,用户可以通过拖拽和粘贴的方式快速进行图像处理。项目还提供了打包后的运行文件下载链接,方便用户使用。

  • OnlyPans:AI定制周晚餐计划

    OnlyPans是一个利用人工智能技术为用户提供定制化晚餐计划的应用程序。它通过与用户的简短聊天来了解用户的预算、口味偏好、语言习惯、饮食限制以及日常生活的忙碌程度,然后快速生成符合用户需求的晚餐计划。随着用户使用时间的增长,OnlyPans会不断学习和优化,提供更加个性化的服务。此外,OnlyPans还提供智能购物清单功能,帮助用户避免食品浪费和不必要的紧急购物。OnlyPans注重用户隐私保护,承诺不会出售用户的任何信息。

今日大家都在搜的词: