首页 > 业界 > 关键词  > Octopusv2最新资讯  > 正文

AI日报:可以在手机上跑的大模型Octopusv2一夜爆火;90后小伙AI“复活”逝者订单超1000;OpenAI允许构建自定义模型;个具有情商的对话型AI来了

2024-04-07 15:41 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240407155231.png

📰🤖📢AI新鲜事

斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火

image.png

【AiBase提要:】

⭐️ 斯坦福大学推出Octopusv2,20亿参数模型,可在手机等设备上运行,准确性和延迟超越GPT-4,上下文长度减少95%。

⭐️ 设备端AI智能体时代来临,Octopusv2开发过程创新函数token策略,训练方法提高推理速度,表现优异。

⭐️ Octopus-V2-2B在性能评估中表现卓越,速度提高168%,为设备端AI发展注入新活力。

论文地址:https://arxiv.org/abs/2404.01744

模型主页:https://huggingface.co/NexaAIDev/Octopus-v2

90后小伙用AI“复活”逝者,一年成交1000单

【AiBase提要:】

⭐️90后小伙张泽伟使用AI技术,为逝者塑造数字形象,已接超过1000笔订单。

⭐️ 他的团队通过还原逝者的相貌、声音,让客户能与其数字形象互动。

⭐️ 这种业务独特之处在于AI技术生成逝者数字形象的反应,无需人类扮演。

详细内容:https://www.chinaz.com/2024/0407/1608319.shtml

OpenAI为开发者添加新功能 允许构建自定义模型

1.png

【AiBase提要:】

⭐️ 开发者可以使用OpenAI的新功能构建特定于组织、业务领域、任务需求的自定义模型。

⭐️ 自定义模型包括专门知识库、特定数据理解、执行任务或特定输入响应。

⭐️ OpenAI提供微调API、自定义训练模型程序和辅助微调服务等功能帮助开发者构建自定义模型。

详细内容:https://openai.com/blog/introducing-improvements-to-the-fine-tuning-api-and-expanding-our-custom-models-program

OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

【AiBase提要:】

🤖 OpenAI使用YouTube视频转录训练GPT-4

📚 AI公司遇到高质量训练数据挑战

⚖️ 公司处理数据问题涉及版权法模糊区域

AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝

图片

【AiBase提要:】

⭐ MiniGPT4-Video框架能理解复杂视频,还能创作诗歌配文。

⭐ 支持处理时态视觉数据和文本数据,善于理解视频的复杂性。

⭐ 在多个基准测试中,MiniGPT4-Video有显着提高,可为视频配文、广告等提供强大解读能力。

论文:https://arxiv.org/pdf/2404.03413.pdf

DeepMind发布Gecko: 专注于文档检索 性能媲美大7倍模型

image.png

【AiBase提要:】

🦎 Gecko是通用文本嵌入模型,专注于文档检索、语义相似度和分类任务。

🦎 Gecko通过从LLM中提炼知识,融入检索器,实现强大检索性能。

🦎 在大规模文本嵌入基准上,256维Gecko优于768维现有模型。

论文地址:https://arxiv.org/pdf/2403.20327.pdf

微软投资1000亿美元推动生成式AI,这支股票有望大涨

【AiBase提要】

🧠 微软部署基于 Arm 设计的定制芯片,有望为 Arm Holdings 带来增长。

📈 Arm Holdings 已受益于人工智能芯片增长,微软项目或进一步推动其业绩。

🔋 微软可能通过定制芯片减少对其他公司依赖,提高性能降低成本,有望带动 Arm 收入增长。

马斯克的朋友将帮助 xAI 筹集30亿美元

【AiBase提要:】

🤑 投资者与马斯克有着密切关系,计划帮助 xAI 筹集30亿美元。

🤖 xAI 与 OpenAI 和 Anthropic 等竞争对手展开竞争,加紧发展在竞争激烈的人工智能领域。

💼 人工智能人才争夺战激烈,xAI 和其他竞争对手竞相吸引和留住。

AI下一个重大飞跃是理解情感,第一个具有情商的对话型AI来了

图片

【AiBase提要:】

⭐️ HumeAI发布具有情感识别能力的对话AI,能检测53种情绪。

⭐️ HumeAI致力于理解和回应用户情感,通过声音特征实现互动。

⭐️ 提供API让用户训练自己的AI模型,应用广泛覆盖健康、客服等领域。

官网地址:https://dev.hume.ai/docs/expression-measurement-api/overview

金山办公 WPS365将发布一站式AI办公产品

【AiBase提要:】

⭐ WPS365将强调提升用户办公效率与体验

⭐ 套件包含内容创作工具和协作软件

⭐ 核心理念是统一工具、协作和管理

🤖📱💼AI应用

Infinity AI:输入剧本即可一键生成电影 还提供数字人克隆功能

image.png

【AiBase提要:】

⭐ 目标:只需要输入剧本内容,即可一键生成电影,官方已经发布Demo

⭐ 技术团队成功克隆CEO形象展示产品功能,提出未来小团队借助AI有望赢得奥斯卡奖预言。

⭐ 提供克隆自己服务,用户可以通过录制视频训练定制AI模型,生成包含自己声音和面部表情的视频内容。

官网:https://top.aibase.com/tool/infinity-ai

在线体验地址:https://studio.infinity.ai/

详细教程及视频:https://qqi2gjmnk4.feishu.cn/wiki/HTmRwpZ1hiRONpkZ3SIce89ynuc?fromScene=spaceOverview

谷歌推Scenic:可识别视频内容 并生成详细描述

image.png

【AiBase提要:】

🔍 提供 SOTA 模型和基线模型,支持快速原型设计大规模视觉模型。

🔍 使用 JAX 和 Flax 进行开发,支持图像、视频、音频和多模态组合模型。

🔍 能识别视频内容并生成详细描述,提供功能丰富的基线模型和数据集。

产品入口:https://top.aibase.com/tool/scenic

CameraCtrl:让文本生成视频实现镜头控制 支持AnimateDiff控制镜头

image.png

【AiBase提要:】

⭐镜头控制在视频生成中至关重要

⭐通过训练镜头编码器实现插拔式镜头模块

⭐不同数据集视频增强镜头控制的可控性和泛化性

产品入口:https://hehao13.github.io/projects-CameraCtrl/

Lixel CyberColor:自动生成无限大的电影级效果的3D场景

image.png

【AiBase提要:】

⭐️ LCC采用Multi-SLAM和高斯溅射技术生成电影级效果的3D场景。

⭐️ XGRIDS的Multi-SLAM算法和3DGS技术创造逼真大型3D模型。

⭐️ XGRIDS提供LCC插件和SDK支持在多平台上无限复制3D内容。

官网地址:https://xgrids.com/lcc

AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快

【AiBase提要:】

⭐️ Universal-1提供准确鲁棒的多语言语音转文字功能

⭐️ Universal-1通过时间戳估计提高了准确性和说话者辨识

⭐️ AssemblyAI利用Conformer RNN-T架构和Google Cloud TPUs构建了高效的Universal-1模型

产品入口:https://top.aibase.com/tool/universal-1

InstantStyle: 文本生成图像风格参考,用于SD保持风格一致

image.png

【AiBase提要:】

⭐️ 内容和风格有效分离,通过简单但强大的技术实现。

⭐️ CLIP全局特征的应用,明确风格和内容的解耦。

⭐️ 不同层级网络捕捉不同语义信息,实现更好的风格保留效果。

产品入口:https://top.aibase.com/tool/instantstyle

————

每日midjourney prompt:性感电商模特

3_1712475023245_ai2023_A_beautiful_Chinese_GirlDetailed_facial_detailslong_hair_da38faab-b655-43c3-abc4-fde1a97fd67e.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful Chinese Girl,Detailed facial details,long hair ,dark hair, wearing a short pink satin dress. She is sitting on concrete stairs in front of a tiled building facade. The lighting is soft and natural, with sunlight casting shadows --ar3:4--v6.0--style raw

一个美丽的中国女孩,详细的面部细节,长发,深色头发,穿着一件粉红色的缎面短裙。她坐在瓷砖建筑正面前的混凝土楼梯上。灯光柔和自然,阳光投射出阴影

举报

  • 相关推荐
  • 大家在看
  • Platonic Representation Hypothesis:探索不同AI系统学习到的表示是否趋于一致。

    Platonic Representation Hypothesis(柏拉图表示假设)是一个关于不同AI系统如何学习和表示现实世界的理论。该理论认为,尽管不同AI系统可能以不同的方式学习(例如图像、文本等),但它们的内部表示最终会趋于一致。这种观点基于所有数据(图像、文本、声音等)都是某种底层现实的投影这一直觉。该理论还探讨了如何衡量表示的一致性,以及导致一致性的因素,如任务和数据压力,以及模型容量的增加。此外,还讨论了这种一致性可能带来的意义和限制。

  • LLM Comparator:比较不同大型语言模型的输出

    LLM Comparator是一个在线工具,用于比较不同大型语言模型(LLMs)的输出。它允许用户输入问题或提示,然后由多个模型生成回答。通过比较这些回答,用户可以了解不同模型在理解、生成文本和遵循指令方面的能力。该工具对于研究人员、开发者和任何对人工智能语言模型有兴趣的人来说都非常重要。

  • Buffup:一款基于 AI 能力的意图识别工具。

    Buffup.AI 是一款基于 AI 的意图识别工具,可根据页面内容确定用户意图,提供快速的问题回答,并支持持续的意图判断。该产品通过最佳的 AI 模型快速回答用户问题,为用户提供持续探索的体验。

  • CAT3D:从多视角图像创建3D场景

    CAT3D是一个利用多视角扩散模型从任意数量的输入图像生成新视角的3D场景的网站。它通过一个强大的3D重建管道,将生成的视图转化为可交互渲染的3D表示。整个处理时间(包括视图生成和3D重建)仅需一分钟。

  • 小窗 AI 问答机:让人工智能成为孩子的私人家教。

    小窗 ® 对话式 AI 问答机是一款基于大语言模型(LLM)的人工智能技术产品,主要面向孩子群体,帮助他们在学习和生活中获取知识,提升独立思考、提问和语言表达能力。该产品的优点包括博学多知的超级博士、随时交谈的外语陪练、无穷创意的写作助手、善解人意的倾诉对象等。该产品定位为面向家庭和教育场景的 AI 助手,为孩子提供全方位的知识获取和交流互动。

  • AlphaRank SEO:AI SEO 优化器,用于提高您的 Shopify 商店在搜索引擎中的排名。

    AlphaRank是一款专为Shopify店铺设计的AI SEO优化工具,能够自动诊断并修复技术SEO问题,生成和优化高质量内容,提升SEO评级,是解锁电商增长的关键。

  • GPT Academic:为GPT/GLM等LLM大语言模型提供实用化交互接口

    GPT Academic是一个针对GPT、GLM等大型语言模型(LLM)的实用化交互接口,特别优化了论文阅读、润色和写作体验。它采用模块化设计,支持自定义快捷按钮和函数插件,能够对Python和C++等项目进行剖析和自译解。此外,它还具备PDF和LaTeX论文翻译和总结功能,支持并行问询多种LLM模型,如chatglm3等本地模型,并接入了通义千问、deepseekcoder、讯飞星火、文心一言、llama2、rwkv、claude2、moss等。

  • Extra Blu:AI产品助手,简化客户旅程,提升销售。

    Extra Blu是一款为Shopify商店设计的AI产品助手,它通过理解客户偏好来推荐合适的产品,实现个性化和直观的购物体验。它能够无缝集成商店知识,如退货政策、常见问题解答和运输详情。Extra Blu坚持透明和公平的定价策略,使用户通过自己的OpenAI密钥,无隐藏费用和额外成本。

  • Podcast Guest Researcher:轻松研究和准备播客嘉宾

    Podcast Guest Researcher 是一个旨在提高播客制作效率的在线工作流程模板。它通过四个步骤帮助用户研究嘉宾背景、准备引人入胜的介绍、选择相关话题以及制定问题,从而创建信息丰富且引人入胜的播客节目。

  • ChatPlayground AI:一站式AI聊天机器人平台,提供多种AI应用和功能。

    ChatPlayground AI是一个集成了16+ AI应用和功能的聊天机器人平台,它允许用户通过一个订阅来访问多种AI模型。该平台的主要优点包括行业领先的AI模型、实时网络搜索、图像生成器、历史记录回顾、多语言支持以及导入自定义内容的能力。ChatPlayground AI旨在为开发者、数据科学家、学生、研究人员、内容创作者、作家和AI爱好者提供服务,帮助他们提高工作效率和创造力。

  • Magic Bookshelf:AI驱动的故事应用,让阅读变得生动有趣。

    Magic Bookshelf 是一款由人工智能驱动的故事应用程序,旨在为儿童和成人提供迷人的阅读体验。它通过独特的魔法般的方式,为共同阅读增添了一种迷人的扭曲,使阅读成为一种愉悦的体验。

  • Omni Jobs:使用AI筛选器搜索超过180K个每日更新的工作。

    Omni Jobs是一个全球性的工作搜索平台,它利用人工智能技术帮助求职者筛选和分类每日更新的超过180,000个工作机会。该平台专注于提供最新和最相关的职位信息,覆盖从技术、市场营销、设计到销售等各个行业和专业领域。Omni Jobs的目标是为求职者提供一个全面、更新迅速且易于使用的工作搜索体验。

  • Jovu:AI驱动的代码生成,快速实现从想法到生产。

    Jovu是一个AI驱动的代码生成模型,旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码,确保一致性、可预测性,并遵循最高标准。Jovu能够加速开发过程,从概念到部署只需几分钟,提供完全可操作的、健壮的后端服务,准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

  • TapScanner:全能扫描仪,AI助力,智能识别与分析。

    TapScanner是一款利用人工智能技术,将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档,提供即时洞察力,并通过扫描轻松提升日常交互。

  • TopicRanker:AI驱动的SERP分析工具,帮助用户发现易于排名的关键词。

    TopicRanker是一款AI驱动的搜索引擎排名分析工具,专注于帮助用户通过分析竞争对手的弱点,发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告,AI生成的标题建议,内容大纲,博客文章,以及增强型元描述,帮助用户优化内容创作,提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的,并且已经帮助多个企业在谷歌上排名第一。价格方面,TopicRanker提供三种不同的订阅计划,满足不同用户的需求。

  • Warmy:通过AI引擎提高电子邮件的投递率

    Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为,为每个邮箱制定个性化的预热计划,确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器,从而最大化邮件的投递率。此外,Warmy的Adeline AI引擎能够实时分析发送性能,预测最佳发送时间和频率,帮助用户提高参与度,避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能,能够主动识别并标记具有高垃圾邮件风险的邮件,帮助用户避免邮件落入垃圾邮件文件夹,确保重要邮件能够送达接收者。

  • Glitter AI:将任何流程转化为逐步指南。

    Glitter AI是一个创新的在线工具,它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程,使得向同事、客户甚至家人传授技能变得简单快捷。

  • Tourly Guide:沉浸式音频导览,让每个地标自己说话

    Tourly Guide是一款移动应用程序,通过使用人工智能技术,为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时,通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示,它由Roadly, Inc.开发,旨在通过技术提升用户的旅游和学习体验。

  • SaveDay App:随时随地保存、管理和利用内容

    SaveDay是一个智能工具,用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案,支持保存文章、网站、图片、视频等,并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护,不与第三方共享用户内容。

  • Neurture:通过了解大脑运作制定改变计划的APP

    Neurture是一个旨在帮助用户了解大脑如何运作,并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能,帮助用户打破习惯或解决成瘾行为,实现重要的其他目标。Neurture强调隐私和信任,不收集用户数据,不投放广告,不训练模型,旨在为用户提供一个安全、无负担的自我提升环境。

今日大家都在搜的词: