首页 > 业界 > 关键词  > MobileDiffusion最新资讯  > 正文

AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro

2024-02-01 15:20 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

谷歌最新文生图小型模型:MobileDiffusion

image.png

【AiBase提要:】

🌟专门为手机开发的文生图模型

🌟0.5秒内生成高质量512x512图像

🌟参数大小:共5.2亿参数

产品入口:https://top.aibase.com/tool/mobilediffusion

产品介绍:https://www.chinaz.com/2024/0201/1594690.shtml

Midjourney测试“风格一致性”功能

image.png

【AiBase提要:】

🌟可以从多张图片学习对应的风格然后结合提示词生成图片

🌟提供一个或多个图像的链接,用以描述想要的统一风格。

🌟该功能支持 V6和 Niji V6版本(不支持 V5等旧版本)

🌟未来将增加“一致性角色”特性

设置教程:https://www.chinaz.com/2024/0201/1594716.shtml

字节跳动推“Coze扣子”AI Bot开发平台

image.png

【AiBase提要:】

🤖 支持用户搭建自己的Chatbot

🔌 提供Bots商店和插件

🌐 功能丰富,包括无限拓展的能力集

官网地址:https://top.aibase.com/tool/coze

上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)

【AiBase提要:】

📈 浦语·灵笔2具有海量图文知识

🔍 输入图片和简短的文字生成图文混排长文章

📉 浦语·灵笔2基于书生·浦语2-7B模型

项目地址:https://top.aibase.com/tool/internlm-xcomposer2

Meta 推ReplaceAnything3D可用文本引导3D场景编辑

【AiBase提要:】

👉提出Erase-and-Replace方法

👉展示了RAM3D的多样性

👉解决了替换3D场景中的挑战

论文网址:https://arxiv.org/pdf/2401.17895.pdf

AI智能剪辑软件——AIMIX

【AiBase提要:】

🌟支持短视频批量混剪生产源源不断的短视频

🌟可以提取视频或音频里的文案,生成视频字幕

🌟提供了十几种真人语音配音,也支持源视频配音

🌟可通过简单的拖动进行场景排序,生成新的短视频脚本

产品入口:https://top.aibase.com/tool/aimixzhijian

产品介绍:https://www.chinaz.com/2024/0201/1594744.shtml

智能海报生成平台嗨AI海报30秒批量生成带货海报

QQ截图20240201094750.png

【AiBase提要:】

⭐ 提供免费AI智能海报生成平台

⭐ 一键生成多种设计风格和模板

⭐ 支持快速生成节日海报、邀请函、日签等

官网地址:https://top.aibase.com/tool/heiaihaibao

免费AI换脸网站Change Face 一键玩转动漫名人变脸

image.png

【AiBase提要:】

⭐ 免费AI换脸网站

⭐ 利用人工智能算法实现面部交换

⭐ 支持换脸图片和视频

官网地址:https://top.aibase.com/tool/changeface-ai

Media2Face:支持语音等多模态引导生成3D面部动态表情

image.png

【AiBase提要:】

🧠 引入广义神经参数化面部资产(GNPFA),高度概括的表达潜在空间解耦表情和身份

🌈 创造 M2F-D 数据集,接受来自音频、文本和图像的多模态引导,拓展了3D面部动画的表现力和风格适应性

💡 Media2Face在共语面部动画领域取得了令人瞩目的成果,为面部动画合成的逼真度和表现力开辟了新的可能性。

产品项目入口:https://sites.google.com/view/media2face

📰🤖📢AI新鲜事

OpenAI着手研发GPT-4的早期预警系统

【AiBase提要:】

🤖 一项研究表明GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果不显著

🌐 研究限制,仅评估信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献

🏥 对100名参与者进行的研究,根据五个结果指标评估了参与者的表现,部分指标有所改善,但效果不足以在统计学上具有显著性

小米小爱同学AI助手通过大模型备案

【AiBase提要:】

⭐ 小爱同学AI助手通过国家备案

⭐ 小爱同学拥有更强大的大脑

⭐ 小爱同学AI助手将面向更广泛用户群体开放体验

谷歌计划推出高级订阅服务Bard Advanced

【AiBase提要:】

⭐ 谷歌计划推出高级订阅服务Bard Advanced

⭐ Bard Advanced将被锁定为订阅模式

⭐ Bard Advanced将由Gemini Ultra提供支持,预计将在“2024年初”发布

LLaVA-1.6来了!赶超Gemini Pro 提升推理性能

【AiBase提要:】

⭐ LLaVA-1.6提升了推理、OCR能力,支持更多场景和广泛用户。

⭐ LLaVA-1.6在多项基准测试中超越了Gemini Pro,并优于Qwen-VL-Plus。

⭐ LLaVA-1.6展现出强大的零样本中文能力,取得了SOTA性能。

Shopify发布“Magic”图像编辑器等AI增强功能,助力商家智能经营

【AiBase提要:】

🤖 "Magic"图像编辑器,自动生成产品描述、常见问题解答等营销文案,大幅提升效率

🤖 “Smart Sidekick”AI商业顾问,提供个性化建议,传递Shopify专业经验

🔍 利用AI改进搜索体验,语义搜索功能通过自然语言处理更好地理解搜索意图,搜索到购买转化率增加了7%

举报

  • 相关推荐
  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

  • 曝苹果Vision Air头显2027年登场:售价腰斩 重量更轻

    知名苹果分析师郭明錤透露,苹果计划于2027年推出轻量版Vision Air,旨在解决当前Vision Pro产品过重、价格高昂的问题。预计Vision Air重量将大幅减少超40%,售价下降约50%。该产品将通过更轻巧外观设计和钛金属材质实现减重目标。苹果CEO库克对其寄予厚望,期待这款头戴设备在未来十年内替代iPhone,成为新一代空间计算时代的引领产品。

  • vivo Vision探索版发布 将于明日开放线下体验

    今日下午,vivo正式发布了备受瞩目的vivo Vision探索版MR头显,尽管该设备暂未确定上市销售时间,但已引发市场广泛关注。从8月22日起,北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动,后续还将有第二批线下体验门店加入,让更多消费者有机会亲身感受这款创新产品的魅力。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 全球最轻的MR头显!vivo Vision探索版亮相:仅重398g

    今天下午,vivo Vision发布会暨影像盛典正式开启,vivo Vision探索版正式亮相,这是蓝厂首款MR头显。 vivo智慧终端产品总经理洪沂介绍,vivo Vision从一开始立项,减重”就是核心命题,因为太重的话大家就很难长时间沉浸体验。 目前市面上的大部分MR头显设备重量都超过了500g,苹果Vision Pro的重量甚至超过了600g,这次vivo Vision探索版的重量压缩至398g,是目前行业内最轻的MR头显。

  • vivo Vision探索版双目8K分辨率 1000度近视也能用

    今日,vivo首款混合现实设备vivo Vision探索版正式亮相。 vivo Vision探索版采用双目8K Micro-OLED屏幕,拥有94% DCI-P3色域,色彩准确度E2。 通过双目校准,保证每台设备的两块屏幕保持一致的、专业级电影监视器的色彩容差体验。

  • 苹果Vision Pro劲敌!vivo韩伯啸:vivo Vision发布会准备中

    vivo通信科技有限公司产品经理韩伯啸今天表示vivo Vision真的要来了,目前发布会已经在紧锣密鼓的准备中了,感兴趣的朋友,可以关注后续的官方公告。

  • B站为何需要视频播客?

    ​最近,内容平台最大的风莫过于视频播客了。 各大平台纷纷发力,竞相涌入这一新赛道。其中,B站则重磅推出《视频播客出圈计划》,吸引了于谦、鲁豫、蔡明、罗永浩、杨迪等众多名人入驻,各类媒体播客也相继加入战局。 从扶持力度上和势头上看,B站无疑将视频播客视为下一个重点发力领域。那么,B站为何需要视频播客?它又能否成为B站新的品牌IP?

  • 手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion

    在手机等移动端侧运行StableDiffusion等文生图生成式AI大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。来自谷歌的一篇论文「MobileDiffusion:SubsecondText-to-ImageGenerationonMobileDevices」,提出了手机端最快文生图,在iPhone15Pro上只要0.2秒。我们相信这将会对今后高效的扩散模型设计产生影响,并拓展移动端应用实例。

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

今日大家都在搜的词: