首页 > 业界 > 关键词  > MobileDiffusion最新资讯  > 正文

AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro

2024-02-01 15:20 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

谷歌最新文生图小型模型:MobileDiffusion

image.png

【AiBase提要:】

🌟专门为手机开发的文生图模型

🌟0.5秒内生成高质量512x512图像

🌟参数大小:共5.2亿参数

产品入口:https://top.aibase.com/tool/mobilediffusion

产品介绍:https://www.chinaz.com/2024/0201/1594690.shtml

Midjourney测试“风格一致性”功能

image.png

【AiBase提要:】

🌟可以从多张图片学习对应的风格然后结合提示词生成图片

🌟提供一个或多个图像的链接,用以描述想要的统一风格。

🌟该功能支持 V6和 Niji V6版本(不支持 V5等旧版本)

🌟未来将增加“一致性角色”特性

设置教程:https://www.chinaz.com/2024/0201/1594716.shtml

字节跳动推“Coze扣子”AI Bot开发平台

image.png

【AiBase提要:】

🤖 支持用户搭建自己的Chatbot

🔌 提供Bots商店和插件

🌐 功能丰富,包括无限拓展的能力集

官网地址:https://top.aibase.com/tool/coze

上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)

【AiBase提要:】

📈 浦语·灵笔2具有海量图文知识

🔍 输入图片和简短的文字生成图文混排长文章

📉 浦语·灵笔2基于书生·浦语2-7B模型

项目地址:https://top.aibase.com/tool/internlm-xcomposer2

Meta 推ReplaceAnything3D可用文本引导3D场景编辑

【AiBase提要:】

👉提出Erase-and-Replace方法

👉展示了RAM3D的多样性

👉解决了替换3D场景中的挑战

论文网址:https://arxiv.org/pdf/2401.17895.pdf

AI智能剪辑软件——AIMIX

【AiBase提要:】

🌟支持短视频批量混剪生产源源不断的短视频

🌟可以提取视频或音频里的文案,生成视频字幕

🌟提供了十几种真人语音配音,也支持源视频配音

🌟可通过简单的拖动进行场景排序,生成新的短视频脚本

产品入口:https://top.aibase.com/tool/aimixzhijian

产品介绍:https://www.chinaz.com/2024/0201/1594744.shtml

智能海报生成平台嗨AI海报30秒批量生成带货海报

QQ截图20240201094750.png

【AiBase提要:】

⭐ 提供免费AI智能海报生成平台

⭐ 一键生成多种设计风格和模板

⭐ 支持快速生成节日海报、邀请函、日签等

官网地址:https://top.aibase.com/tool/heiaihaibao

免费AI换脸网站Change Face 一键玩转动漫名人变脸

image.png

【AiBase提要:】

⭐ 免费AI换脸网站

⭐ 利用人工智能算法实现面部交换

⭐ 支持换脸图片和视频

官网地址:https://top.aibase.com/tool/changeface-ai

Media2Face:支持语音等多模态引导生成3D面部动态表情

image.png

【AiBase提要:】

🧠 引入广义神经参数化面部资产(GNPFA),高度概括的表达潜在空间解耦表情和身份

🌈 创造 M2F-D 数据集,接受来自音频、文本和图像的多模态引导,拓展了3D面部动画的表现力和风格适应性

💡 Media2Face在共语面部动画领域取得了令人瞩目的成果,为面部动画合成的逼真度和表现力开辟了新的可能性。

产品项目入口:https://sites.google.com/view/media2face

📰🤖📢AI新鲜事

OpenAI着手研发GPT-4的早期预警系统

【AiBase提要:】

🤖 一项研究表明GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果不显著

🌐 研究限制,仅评估信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献

🏥 对100名参与者进行的研究,根据五个结果指标评估了参与者的表现,部分指标有所改善,但效果不足以在统计学上具有显著性

小米小爱同学AI助手通过大模型备案

【AiBase提要:】

⭐ 小爱同学AI助手通过国家备案

⭐ 小爱同学拥有更强大的大脑

⭐ 小爱同学AI助手将面向更广泛用户群体开放体验

谷歌计划推出高级订阅服务Bard Advanced

【AiBase提要:】

⭐ 谷歌计划推出高级订阅服务Bard Advanced

⭐ Bard Advanced将被锁定为订阅模式

⭐ Bard Advanced将由Gemini Ultra提供支持,预计将在“2024年初”发布

LLaVA-1.6来了!赶超Gemini Pro 提升推理性能

【AiBase提要:】

⭐ LLaVA-1.6提升了推理、OCR能力,支持更多场景和广泛用户。

⭐ LLaVA-1.6在多项基准测试中超越了Gemini Pro,并优于Qwen-VL-Plus。

⭐ LLaVA-1.6展现出强大的零样本中文能力,取得了SOTA性能。

Shopify发布“Magic”图像编辑器等AI增强功能,助力商家智能经营

【AiBase提要:】

🤖 "Magic"图像编辑器,自动生成产品描述、常见问题解答等营销文案,大幅提升效率

🤖 “Smart Sidekick”AI商业顾问,提供个性化建议,传递Shopify专业经验

🔍 利用AI改进搜索体验,语义搜索功能通过自然语言处理更好地理解搜索意图,搜索到购买转化率增加了7%

举报

  • 相关推荐
  • 雷军:希望小米VisionGT超跑让大家感受到电动时代极致驾驶体验

    在本次MWC大会上,小米正式展示了旗下的超级跑车Vision Gran Turismo。这款充满未来感的赛车一经亮相,便迅速吸引了全球汽车爱好者与科技博主的关注。 根据官方介绍,这款概念车在设计之初就追求极致的空气动力学性能。它不仅拥有极低的风阻系数,还具备强大的下压力表现。设计师试图通过创新的车身结构,彻底突破传统超跑的效率边界。

  • 小米概念超跑Vision GT确认不会量产 将登陆索尼游戏《GT赛车》

    2月28日,小米在巴塞罗那举行新品发布会,正式发布旗下首款Vision Gran Turismo概念车型Xiaomi Vision Gran Turismo(简称小米Vision GT)。 随后,小米汽车发布答网友问,对小米Vision GT的七大疑问进行集中回应。 据介绍,小米Vision GT是小米应Gran Turismo系列制作人山内一典邀请,为GT模拟驾驶平台特别打造的纯电动智能概念超跑。 小米表示,全球顶尖汽车品牌如布加迪、法拉利、保时捷

  • 小米MWC要放大招:网友拍到Vision GT超跑概念车 外形很上头

    备受瞩目的MWC盛会开幕在即,小米似乎已经准备好了一份重量级的惊喜,有网友在社交媒体上捕捉到了关键端倪。 有博主在西班牙巴塞罗那街头拍到了一台疑似小米未发布的全新超跑。这台车拥有流畅且充满肌肉感的线条,轮毂罩上清晰地印着xiaomi字样。 这款新车在这个时间节点出现在巴塞罗那,引发了广泛关注。外界推测,小米很有可能是为了即将开幕

  • 卢伟冰回应推出小米Vision GT概念车:并不脱离物理规律 理论上可以实现

    小米在MWC2026上发布首款超级跑车概念车Vision+GT,该车不会量产,而是登陆《GT赛车》游戏供玩家体验。小米集团合伙人卢伟冰表示,游戏团队因小米SU7系列受全球关注而邀请合作,希望小米发挥想象力设计未来赛车。概念车虽虚拟,但符合空气动力学原理,理论上可实现。与传统车企追求极限性能不同,小米作为科技公司,融入大量基于AI的人机交互创新,让车能感知人。此次合作反映了全球对中国科技及小米的认可。

  • 小米首款超跑概念车来了 雷军宣布Vision GT实车明天亮相MWC

    小米CEO雷军宣布,小米Vision GT概念车将于明日亮相世界移动通信大会。该车是《GT赛车》游戏邀请全球顶尖汽车品牌为游戏平台打造的未来超跑概念车项目,小米是首个受邀参与的中国品牌。Vision GT设计极具未来感,采用低趴宽体车身,配备巨型环形星环尾灯,视觉冲击力强。整车强调极致空气动力学设计,风阻系数低至0.29。座舱搭载小米全景显示天穹屏,支持人车家生态联动。此外,小米SU7 Ultra已于今年1月上线《GT赛车7》,成为该系列自1997年诞生以来首款登陆该平台的中国品牌车型。

  • 突破海外框架局限,夸夸菁领DinTal Claw政务龙虾落地赋能民生

    3月6日,被誉为中国版“OpenClaw”的自主智能体DinTal+Claw在深圳福田区完成政务外网本地化部署并全面上岗。该系统具备“自主学习、自进化”能力,从辅助工具升级为第三代智能体,实现“越用越聪明”。在民调、审批等高频场景中,将调研时间从两周缩短至数分钟,实现“当日提交、当日预审”,大幅提升政务效率。其全栈自研技术支撑“一键安装”和“零门槛”部署,打�

  • 苹果官网上架Studio Display XDR:27英寸5K视网膜屏 24999元起

    苹果推出新款Studio Display XDR专业显示器,起售价24999元。它采用27英寸5K视网膜XDR屏幕,配备mini-LED背光系统,实现2000尼特HDR峰值亮度,支持120Hz高刷新率和自适应同步技术。内置1200万像素Center Stage摄像头,具备出色画质和低光表现。音频方面配备录音棚级三麦克风阵列,利用定向波束成形技术过滤环境噪音。接口配置两个雷雳5端口,支持高速数据传输和多显示器串联。此外,苹果还同步更新了标准版Studio Display,采用普通LED面板,峰值亮度600尼特,刷新率60Hz,起售价11999元。

  • NVIDIA干得漂亮!最新595.76驱动跑分提升7%:游戏暴增30帧

    NVIDIA近期显卡驱动更新频出问题,595.59版导致风扇停转被撤回,595.71版又存在电压限制问题,导致GPU性能大幅下降。随后紧急发布的595.76热修复驱动解决了电压限制问题。用户实测显示,更新后RTX 50系列显卡性能明显提升,部分游戏帧数增幅达15-30 FPS。华硕PRIME RTX 5080在3DMark测试中创个人记录,Steel Nomad基准测试提升约7%。多位用户证实新驱动让显卡超频状态下能稳定维持高频率运行,游戏性能显著改善。

  • 超级马力喜迎新年 武汉万达瑞华酒店新春DIY

    2026年2月,武汉万达瑞华酒店推出“超级马力+喜迎新年”春节亲子DIY系列活动,将传统年俗文化与趣味亲子互动结合,于2月15日至23日开启为期九天的新春欢乐盛宴。活动每日设置不同主题,如写福字、包汤圆、剪纸艺术、制作糖葫芦、拓印年画等,让家庭宾客在美食相伴的同时,深度感受中华传统年俗的魅力。酒店还营造浓郁新春氛围,邀宾客与家人相聚,体验年俗乐趣,品

  • 手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion

    在手机等移动端侧运行StableDiffusion等文生图生成式AI大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。来自谷歌的一篇论文「MobileDiffusion:SubsecondText-to-ImageGenerationonMobileDevices」,提出了手机端最快文生图,在iPhone15Pro上只要0.2秒。我们相信这将会对今后高效的扩散模型设计产生影响,并拓展移动端应用实例。

今日大家都在搜的词: