首页 > 业界 > 关键词  > 哄哄模拟器最新资讯  > 正文

AI视野:哄哄模拟器爆火;零一万物多模态模型上线;InstantID模型发布;Depth Anything社交网络走红

2024-01-23 15:20 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

哄哄模拟器爆火70万网友同时在线难倒开发者

image.png

【AiBase提要:】

🔥 「哄哄模拟器」24小时爆火,70万网友在线哄赛博女友!10亿token一天烧完

🎮 游戏模拟哄赛博女友原谅,得高原谅值考验情商

💔 用户赛博女友哄赔10亿token,开发者困扰流量及开发问题

InstantID模型发布 相比PhotoMaker保留了良好的文本可编辑性

image.png

【AiBase提要:】

👩‍🔬 InstantID实现了更好的保真度

👨‍🎨 InstantID支持多重参考

🎭 InstantID保留了良好的文本可编辑性

项目地址:https://top.aibase.com/tool/instantid

模型下载地址:https://huggingface.co/InstantX/InstantID

谷歌Gmail新功能“Help Me Write”将很快支持语音输入

QQ截图20240123092047.jpg

【AiBase提要:】

📱 "Help Me Write"新功能即将支持语音输入

🤖 语音输入功能将使用户更轻松地起草电子邮件

📧 功能目前仍处于实验室测试阶段

傅盛发布猎户星空大模型Orion-14B 拥有140亿参数规模

【AiBase提要:】

🌐140亿参数规模的大模型发布

🌐 猎户星空大模型的特点

🌐 猎户星空提供的AI辅助决策服务

开源地址:

https://github.com/OrionStarAI/Orion

https://huggingface.co/OrionStarAI

零一万物Yi-VL多模态语言模型上线

【AiBase提要:】

🔹 Yi-VL模型在英文数据集MMM和中文数据集CMMMU上领先

🔹 Yi-VL-34B、Yi-VL-6B两个版本在全新多模态基准测试MMM上表现出色

🔹 Yi-VL模型训练过程分为三个阶段

Yi-VL 模型地址:

https://huggingface.co/01-ai

https://www.modelscope.cn/organization/01ai

讯飞星火大模型V3.5将于1月30日发布 星火开源大模型等将亮相

【AiBase提要:】

⭐ 讯飞星火V3.5将基于全国产化算力平台进行训练

首次实现了全民开放大模型,核心能力大幅提升

⭐ 发布首部企业史《星火相传》,回顾创业精神谱系

港大、TikTok推新MDE模型Depth Anything 分分钟看穿纪念碑谷式错觉图像

image.png

【AiBase提要:】

🔸Depth Anything是一种可以利用大规模无标注图像的单目深度估计模型

🔸模型具备更好的零样本能力以及更好的效果

🔸设计一种数据引擎来收集和自动标注大规模无标注数据,扩大数据集的规模

项目地址:https://top.aibase.com/tool/depth-anything

📰🤖📢AI新鲜事

AI语音公司ElevenLabs B轮融资8000万美元,估值超10亿美元

【AiBase提要:】

🤖 完成8000万美元B轮融资,由Andreessen Horowitz、Nat Friedman等领投。

💼 公司计划通过改进检测工具、与分发平台合作等方式提高AI语音技术的责任和道德发展水平。

🚀 本轮融资将用于产品开发、扩展基础设施和团队、AI研究以及加强安全措施。

产品体验入口:https://top.aibase.com/tool/elevenlabs

Anthropic计划为Claude增加图像识别能力

【AiBase提要:】

🚀 Claude即将具备图像识别能力。

💰 Anthropic已得到Amazon和Google支持。

🔥2024年收入预计达50亿美元。

LeCun:生成模型不适合处理视频,AI 理解视频得在抽象空间中进行预测

【AiBase提要:】

⭐ 生成模型不适合处理视频

⭐ AI理解视频需要在抽象空间中进行预测

⭐ 需要新的架构来处理视频输入

Stable Diffusion采样器原理对比及选择建议

AiBase提要:

⭐DDIM通过更少的处理步骤就能取得更佳的效果。

⭐PLMS在 50 步处理过程中,就能实现比DDIM在 1000 步中所达到的更高图像质量。

⭐Euler是最简单直接的采样器,处理速度快

详细内容点此查看:https://m.chinaz.com/2024/0123/1592359.shtml

OpenAI 竞争对手 Cohere 正在洽谈融资10亿美元

【AiBase提要:】

📈 加拿大初创公司Cohere将融资10亿美元

💰 目前估值达到22亿美元

🤖 Cohere开发大型语言模型

举报

  • 相关推荐
  • 大家在看
  • InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

    InstantStyle是由InstantID原班团队推出的一种新的风格迁移方法,它专注于解决图像生成中的风格化问题,即生成与参考图像风格一致的图像。这项技术的核心在于实现风格和内容的有效分离,从在不牺牲内容信息的情况下,注入所期望的艺术风格。随着InstantStyle与InstantID的联名,风格化图像生成的可能性将更加丰富。

  • MiniGPT4-Video官体验入口 视频理解多模态AI大模型使用地址

    MiniGPT4-Video是什么?MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。用户可以上传视频,让模型生成标题与宣传语,理解特效处理,或作超美抒情诗。

  • Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

    MetaAI近日推出了一种名为MA-LMM的新型模型,旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力,但在处理视频输入方面存在一些限制,例如上下文长度限制和GPU内存限制。其创新性的设计以及利用长期记忆库和顺序处理的方法使得该模型能够在各种复杂场景下取得显著成果,证明了其在多模态视频理解应用中的有效性和多功能性。

  • 多模态大模型Reka Core发布 性能与GPT-4相媲美

    RekaCore是一款最新发布的多模态大型语言模型,其性能可与GPT-4相媲美,甚至在某些方面超越了现有的前沿模型。这一技术突破为人工智能领域带来了新的里程碑,特别是在图像、视频和音频的上下文理解能力方面。随着Core的进一步优化和应用,我们有理由相信,它将在多个领域产生深远的影响,推动人工智能技术的进步和社会的发展。

  • 理想汽车 Mind GPT 多模态认知大模型通过国家备案

    理想汽车宣布其全自研的多模态认知大模型——MindGPT,已正式通过国家《生成式人工智能服务管理暂行办法》的备案。这一里程碑式的事件标志着理想汽车成为首个通过该备案的汽车厂商自研大模型。它不仅支持方言自由说、指令自由说具备简洁模式以及全时全车免唤醒的能力,为用户提供了更加便捷、智能的交互体验。

  • 开源AI平台Lightning AI发布AI编译器Thunder”以加速模型训练

    开源人工智能平台LightningAI宣布与Nvidia合作,发布了名为“Thunder”的下一代AI编译器,旨在加速人工智能模型的训练速度。据LightningAI称,该编译器在实际场景中相比未优化的代码,可将大型语言模型的训练速度提高高达40%。LightningStudios的产品可以按四个定价级别购买:个人开发者免费,工程师、研究人员和科学家专业级;初创公司和团队的团队级别,以及大型组织的企业级别。

  • 马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

    在人工智能领域,多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。

  • AI日报:首个AI程序员Devin造假被抓;​Sora平替?StreamingT2V试玩地址公布;Udio AI还可以创作喜剧、演讲;XAI发布Grok-1.5Vision多模态模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Sora平替?2分钟超长AI视频模型StreamingT2V免费开源试玩地址公布UdioAI提供多功能音频生成还可以创作喜剧、演讲、电台广播等美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格StableDesign:适用于室内装修设计的SD方案文字提示就可修改室内设计图比换脸更强大!SwapAnything:替换图片中的任意元素AI延时视频生成工具MagicTime在线体验地址放出自动化写作工具STORM:可生成像维基百科一样的深度长篇内容Meta推出ViewDiff模型:文本生成多视角3D图像📰🤖📢AI新鲜事首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上马斯克XAI发布Grok-1.5Vision多模态模型,可处理文本和图片信息360智脑7B参数大模型正式开源最长支持约50万字输入Adobe图像生成AI“Firefly”训练集中约有5%为AI图像代码、模型全开源!贾佳亚团队多模态模型Mini-Gemini登上热榜面壁智能开源MiniCPM2.0系列模型OCR等能力显著增强竞争升温!ChatGPT增长疲软3月全球访问量17.7亿次,Claude逐渐崛起InstantID团队推新风格迁移方法InstantStyle一键置身“梵高星空”——————每日midjourneyprompt:小说古风美女图源备注:图片由AI生成,图片授权服务商MidjourneyAbeautifulwomanfromancientChina,dressedinagorgeousredHanfu,withlonghairdrapedoverhershoulders,satinherboudoirwithasmile.Ancientstyle,hanfu,boudoir,gorgeous,palace,screen,carpet,softlight,eleganttemperament,ancientculture,inlinewithorientalaesthetics,richdetails,bestquality,exquisitemakeup,cleareyelinerpen,slendereyebrows,texturedskin,whiteskin,charmingheaddress,--ar3:4--niji6--styleraw一个中国古代美女,穿着华丽的红色汉服,长发披肩,微笑着坐在闺房内。

  • 代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

    香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力,也为多模态模型的发展和应用开辟了新的可能性。

  • 李未可科技正式推出WAKE-AI多模态AI大模型

    4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹视觉语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力,便于更多企业及开发者调用WAKE-AI能力,共建AI硬件生态。

今日大家都在搜的词:

热文

  • 3 天
  • 7天