AI视野：哄哄模拟器爆火；零一万物多模态模型上线；InstantID模型发布；Depth Anything社交网络走红

2024-01-23 15:20 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

哄哄模拟器爆火70万网友同时在线难倒开发者

【AiBase提要:】
🔥 「哄哄模拟器」24小时爆火，70万网友在线哄赛博女友!10亿token一天烧完
🎮 游戏模拟哄赛博女友原谅，得高原谅值考验情商
💔 用户赛博女友哄赔10亿token，开发者困扰流量及开发问题

InstantID模型发布相比PhotoMaker保留了良好的文本可编辑性

【AiBase提要:】
👩‍🔬 InstantID实现了更好的保真度
👨‍🎨 InstantID支持多重参考
🎭 InstantID保留了良好的文本可编辑性
项目地址:https://top.aibase.com/tool/instantid
模型下载地址:https://huggingface.co/InstantX/InstantID

谷歌Gmail新功能“Help Me Write”将很快支持语音输入

【AiBase提要：】
📱 "Help Me Write"新功能即将支持语音输入
🤖 语音输入功能将使用户更轻松地起草电子邮件
📧 功能目前仍处于实验室测试阶段

傅盛发布猎户星空大模型Orion-14B 拥有140亿参数规模

【AiBase提要:】

🌐140亿参数规模的大模型发布

🌐 猎户星空大模型的特点

🌐 猎户星空提供的AI辅助决策服务

开源地址:
https://github.com/OrionStarAI/Orion
https://huggingface.co/OrionStarAI

零一万物Yi-VL多模态语言模型上线

【AiBase提要:】
🔹 Yi-VL模型在英文数据集MMM和中文数据集CMMMU上领先
🔹 Yi-VL-34B、Yi-VL-6B两个版本在全新多模态基准测试MMM上表现出色
🔹 Yi-VL模型训练过程分为三个阶段
Yi-VL 模型地址:
https://huggingface.co/01-ai
https://www.modelscope.cn/organization/01ai

讯飞星火大模型V3.5将于1月30日发布星火开源大模型等将亮相

【AiBase提要:】
⭐ 讯飞星火V3.5将基于全国产化算力平台进行训练
⭐ 首次实现了全民开放大模型，核心能力大幅提升
⭐ 发布首部企业史《星火相传》，回顾创业精神谱系

港大、TikTok推新MDE模型Depth Anything 分分钟看穿纪念碑谷式错觉图像

【AiBase提要:】
🔸Depth Anything是一种可以利用大规模无标注图像的单目深度估计模型
🔸模型具备更好的零样本能力以及更好的效果
🔸设计一种数据引擎来收集和自动标注大规模无标注数据，扩大数据集的规模
项目地址:https://top.aibase.com/tool/depth-anything

📰🤖📢AI新鲜事

AI语音公司ElevenLabs B轮融资8000万美元，估值超10亿美元

【AiBase提要:】
🤖 完成8000万美元B轮融资，由Andreessen Horowitz、Nat Friedman等领投。
💼 公司计划通过改进检测工具、与分发平台合作等方式提高AI语音技术的责任和道德发展水平。
🚀 本轮融资将用于产品开发、扩展基础设施和团队、AI研究以及加强安全措施。
产品体验入口:https://top.aibase.com/tool/elevenlabs

Anthropic计划为Claude增加图像识别能力

【AiBase提要:】
🚀 Claude即将具备图像识别能力。
💰 Anthropic已得到Amazon和Google支持。
🔥2024年收入预计达50亿美元。

LeCun：生成模型不适合处理视频，AI 理解视频得在抽象空间中进行预测

【AiBase提要：】
⭐ 生成模型不适合处理视频
⭐ AI理解视频需要在抽象空间中进行预测
⭐ 需要新的架构来处理视频输入

Stable Diffusion采样器原理对比及选择建议

AiBase提要：
⭐DDIM通过更少的处理步骤就能取得更佳的效果。
⭐PLMS在 50 步处理过程中，就能实现比DDIM在 1000 步中所达到的更高图像质量。
⭐Euler是最简单直接的采样器，处理速度快
详细内容点此查看：https://m.chinaz.com/2024/0123/1592359.shtml

OpenAI 竞争对手 Cohere 正在洽谈融资10亿美元

【AiBase提要:】
📈 加拿大初创公司Cohere将融资10亿美元
💰 目前估值达到22亿美元
🤖 Cohere开发大型语言模型

（举报）

相关推荐
大家在看

关键词：

哄哄模拟器

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

InstantStyle是由InstantID原班团队推出的一种新的风格迁移方法，它专注于解决图像生成中的风格化问题，即生成与参考图像风格一致的图像。这项技术的核心在于实现风格和内容的有效分离，从在不牺牲内容信息的情况下，注入所期望的艺术风格。随着InstantStyle与InstantID的联名，风格化图像生成的可能性将更加丰富。

InstantStyle AI头条
MiniGPT4-Video官网体验入口视频理解多模态AI大模型使用地址

MiniGPT4-Video是什么？MiniGPT4-Video是为视频理解设计的多模态大模型，能处理时态视觉数据和文本数据，配标题、宣传语，适用于视频问答。用户可以上传视频，让模型生成标题与宣传语，理解特效处理，或作超美抒情诗。

MiniGPT4-Video
Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

MetaAI近日推出了一种名为MA-LMM的新型模型，旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力，但在处理视频输入方面存在一些限制，例如上下文长度限制和GPU内存限制。其创新性的设计以及利用长期记忆库和顺序处理的方法使得该模型能够在各种复杂场景下取得显著成果，证明了其在多模态视频理解应用中的有效性和多功能性。

MA-LMM AI头条
多模态大模型Reka Core发布性能与GPT-4相媲美

RekaCore是一款最新发布的多模态大型语言模型，其性能可与GPT-4相媲美，甚至在某些方面超越了现有的前沿模型。这一技术突破为人工智能领域带来了新的里程碑，特别是在图像、视频和音频的上下文理解能力方面。随着Core的进一步优化和应用，我们有理由相信，它将在多个领域产生深远的影响，推动人工智能技术的进步和社会的发展。

多模态大模型 AI头条
理想汽车 Mind GPT 多模态认知大模型通过国家备案

理想汽车宣布其全自研的多模态认知大模型——MindGPT，已正式通过国家《生成式人工智能服务管理暂行办法》的备案。这一里程碑式的事件标志着理想汽车成为首个通过该备案的汽车厂商自研大模型。它不仅支持方言自由说、指令自由说具备简洁模式以及全时全车免唤醒的能力，为用户提供了更加便捷、智能的交互体验。

理想汽车多模态认知大模型 Mind
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练

开源人工智能平台LightningAI宣布与Nvidia合作，发布了名为“Thunder”的下一代AI编译器，旨在加速人工智能模型的训练速度。据LightningAI称，该编译器在实际场景中相比未优化的代码，可将大型语言模型的训练速度提高高达40%。LightningStudios的产品可以按四个定价级别购买:个人开发者免费，工程师、研究人员和科学家专业级;初创公司和团队的团队级别，以及大型组织的企业级别。

LightningAI Thunder AI编译器
马斯克XAI发布Grok-1.5 Vision 多模态模型可处理文本和图片信息

在人工智能领域，多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision，这一模型不仅能够处理文本信息能够理解和分析各种视觉数据，如文档、图表、截图和照片，标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用，我们有理由相信，它将在多个领域发挥重要作用，推动人工智能技术向前发展。

Grok-1.5Vision AI头条
荐AI日报：首个AI程序员Devin造假被抓；Sora平替?StreamingT2V试玩地址公布；Udio AI还可以创作喜剧、演讲；XAI发布Grok-1.5Vision多模态模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI提供多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓，Devin再次“震撼”硅谷!扒皮视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型，可处理文本和图片信息360智脑7B参数大模型正式开源最长支持约50万字输入Adobe图像生成AI“Firefly”训练集中约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次，Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注：图片由AI生成，图片授权服务商MidjourneyAbeautifulwomanfromancientChina，dressedinagorgeousredHanfu，withlonghairdrapedoverhershoulders，satinherboudoirwithasmile.Ancientstyle，hanfu，boudoir，gorgeous，palace，screen，carpet，softlight，eleganttemperament，ancientculture，inlinewithorientalaesthetics，richdetails，bestquality，exquisitemakeup，cleareyelinerpen，slendereyebrows，texturedskin，whiteskin，charmingheaddress，--ar3:4--niji6--styleraw一个中国古代美女，穿着华丽的红色汉服，长发披肩，微笑着坐在闺房内。

Devin
代码、模型全开源！贾佳亚团队多模态模型 Mini-Gemini登上热榜

香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型，该模型在多模态任务榜单上取得了显著成绩，其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力，也为多模态模型的发展和应用开辟了新的可能性。

Mini-Gemini AI头条
李未可科技正式推出WAKE-AI多模态AI大模型

4月18日，2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹视觉语音打造新一代LLM-Based的自然交互，同时多模态问答技术的加持，能实现所见即所问、所问即所得的精准服务。李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力，便于更多企业及开发者调用WAKE-AI能力，共建AI硬件生态。

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

AI视野：哄哄模拟器爆火；零一万物多模态模型上线；InstantID模型发布；Depth Anything社交网络走红

今日大家都在搜的词：

热文

站长商机