首页 > 业界 > 关键词  > Gemma最新资讯  > 正文

AI视野:谷歌开源小参数大模型Gemma;李一舟AI课程小程序因违规被暂停服务;Sora AI视频生成器模板sorafm开源;字节跳动开发 SDXL-Lightning

2024-02-22 15:47 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240222160622.png

🤖📱💼AI应用

谷歌开源Gemma:参数小、性能超越Llama2,可轻松在笔记本上运行

图片

【AiBase提要:】

⭐ Gemma采用Gemini架构,有20亿、70亿两个版本,性能强悍。

⭐ Gemma支持普通笔记本、台式机运行,无需庞大AI算力。

⭐ Gemma优化跨框架、设备、硬件,与NVIDIA合作,适用于Google Cloud。

项目入口网址:https://top.aibase.com/tool/gemma

比DOMOAI还原能力更强!GoEnhance AI视频转绘更稳定更流畅

【AiBase提要:】

⭐️ 可以将视频转换成多种不同风格的视频

⭐️ 视频转绘更稳定流畅

⭐️ 更强的还原度,碾压DOMOAI

官网地址:https://top.aibase.com/tool/goenhance-ai

开发者开源Sora AI视频生成器模板sorafm

image.png

【AiBase提要:】

⭐ Sora火爆但未正式开放,开发者着手开源项目。

⭐ sora.fm是一个全栈开发的Sora AI视频生成器模板。

⭐ 开发者计划建立Sora Showcase网站,吸引流量提前上线。

网页:https://top.aibase.com/tool/sora-ai-video-generator

项目地址:https://github.com/all-in-aigc/sorafm

腾讯会议AI小助手上线 基于“混元”大模型打造

【AiBase提要:】

⭐ 腾讯会议AI小助手全面覆盖会议各环节,提升效率和信息流转速度。

⭐ 实时生成会议纪要,智能提炼讨论内容,高效明确工作方向。

⭐ 基于腾讯自研的大语言模型“混元”,具备强大技术支撑。

SDXL-Lightning:一个步骤就能生成1024分辨率高清图像

image.png

【AiBase提要:】

⭐️ SDXL-Lightning项目由字节跳动开发,采用创新蒸馏策略。

⭐️ 通过渐进式蒸馏和对抗式蒸馏解决生成速度和质量问题。

⭐️ SDXL-Lightning模型开源支持LoRA版本和UNet权重版本。

模型地址:https://top.aibase.com/tool/sdxl-lightning

PixelPlayer:能自动从视频中识别和分离不同的声音源

image.png

【AiBase提要:】

⭐ 自动识别视频中不同声音源

⭐ 分离声音并与视频位置匹配

⭐ 核心功能包括声音源分离、声音定位和多声音源处理

项目地址:https://top.aibase.com/tool/pixelplayer

📰🤖📢AI新鲜事

李一舟AI课程小程序因违规被暂停服务199元人工智能课已被下架

【AiBase提要】

⭐️ 微信小程序“一舟一课”因违规被暂停服务

⭐️199元的人工智能课已被下架

⭐️ 李一舟通过AI课程在3年内的收入超过亿元

谷歌紧急修复Gemini AI图片生成,因生成作品种族歧视问题

【AiBase提要:】

🤖 谷歌赶紧修复新的AI工具,避免被指责过于防止种族歧视

🌐 AI在多样性问题上的失误引发了争议

🔧 谷歌Gemini AI生成图像存在种族歧视问题,公司紧急修复

疯狂发力!谷歌将Gemini集成到Gmail、Docs等企业工具

【AiBase提要:】

⭐️ 谷歌推出面向企业的AI工具,Gemini模型提供支持,降低价格与微软竞争。

⭐️ Gemini将集成在Google Workspace的应用中,每月20-30美元不等。

⭐️ 谷歌表示将推出独立的聊天体验“Chat with Gemini”,对话不用于广告目的。

AI美女,组团在抖音卖货

图片

【AiBase提要:】

⭐ AI种草博主通过AI生成内容,在抖音带货赚取佣金。

⭐ 视频内容简陋,但流量不差,带货路径已经跑通。

⭐ 难点在于账号运营,需要注意避免触犯法律法规。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

【AiBase提要:】

⭐ 蒋路是谷歌VideoPoet项目负责人,加入TikTok,研发视频模型对抗Sora。

⭐ VideoPoet在技术上与Sora相似,生成10秒视频,是AI视频生成领域领先者。

⭐ 蒋路拥有丰富科研经历,曾在谷歌和CMU任职,是大厂必争的AI基石型人才。

举报

  • 相关推荐
  • AI日报:重磅!阿里新夸克升级为“AI超级框”;谷歌开源多模态模型Gemma-3;潞晨科技开源视频大模型Open-Sora 2.0

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。智谱在融资方面表现优异,去年成功完成多轮融资,总额超过40亿元,吸引了多家知名投资机构。

  • 英伟达全力发展AI Agent开源专属大模型,最强AI工厂

    全球AI领导者英伟达在美国圣何塞举办了“GTC2025”全球产品、开发者大会,涵盖大模型、AIAgent、实体机器人、AI专用芯片、量子计算等技术分享。LlamaNemotron一共有Nano、Super和Ultra三种模型,每种都针对不同的部署需求进行了优化。Nano模型适用于个人电脑和边缘设备,例如,手机、平板、笔记本等;Super模型在单个GPU上提供最佳的准确性和吞吐量;Ultra模型在多GPU服务器上提供最大的Agent准确性。

  • 字节跳动豆包团队开源MoE架构优化技术:可将大模型训练效率提升1.7倍

    据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。开源不仅有助于加速行业技术发展能为更多研究者和开发者提供宝贵的资源,进一步推动人工智能技术的创新与应用。

  • 谷歌:我们的Gemma 3,单GPU便能媲美Deepseek

    在AI领域,“经济效益”一直是热门话题,在DeepSeek实现了令人瞠目的规模经济效益之后,谷歌也不甘落后地加紧了步伐。谷歌发布了他们最新的开源大型语言模型Gemma3。需要注意的是,竞争对手使用的H100芯片数量都是谷歌的估计,Deepseek仅披露了一个使用1814块英伟达性能稍弱的H800GPU芯片来作为R1模型提供服务的例子。

  • 字节跳动火山引擎AI一号位离职:已加盟一清华系公司担任CEO

    近日,原字节跳动AI大将、火山引擎AI应用产品线一号位骆怡航已离职,且加入生数科技,担任CEO一职,全面负责公司研发、产品、商业化及团队管理工作。骆怡航毕业于清华大学自动化系,在云计算及AI领域有超过十年的工作经验,拥有扎实的技术背景、产业理解和商业化经验。2025年1月,生数科技还发布视频大模型Vidu2.0,视频生成速度突破10秒以内,成本降至不到行业平均水平的一半。

  • 单GPU运行最强模型谷歌推出Gemma 3:单卡可跑27B超o3-mini

    谷歌发布了其最新的开源模型系列Gemma3,并宣称这是世界上最好的单加速器模型”。即便在参数量最大的27B版本中,仅需一张H100显卡即可实现高效推理。ShieldGemma2为图像安全提供了现成的解决方案,能够输出三类安全标签:危险内容、色情内容和暴力内容,帮助开发者快速构建安全的AI应用。

  • 见过开源模型,没见过直接开源AI应用的,这把火山引擎玩大了

    源神启动!大模型开源潮从模型卷向了应用,这一次下场的超级玩家是火山引擎。3月3日,火山引擎正式上线“大模型应用实验室”平台,一口气开源了手机助手、DeepSeek联网版、实时视频理解、互动双语视频生成器等AI应用,涵盖移动终端、内容创作以及教育娱乐等多个领域。火山引擎“大模型应用实验室”的开源应用代码托管在GitHub上,开发者可以通过以下链接访问:https://gith

  • AI日报:X官方账号被冻结!Manus平替开源版来袭;腾讯混元图生视频模型开源;Mistral AI推世界最强OCR

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、三小时复刻Manus!OpenManus横空出世,斩获GitHub3000星标OpenManus项目在短短三小时内复刻了Manus智能体,并迅速在GitHub上获得了超过3300个星标。超过5,600名艺术家联合签署公开信,抗议此次拍卖,认为许多作品侵犯了版权。

  • 腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器

    今日,腾讯混元宣布发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。企业和开发者可在腾讯云申请使用API接口,用户通过混元AI视频官网即可体验。腾讯混元表示,此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持130亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。

  • 拼多多AI大模型暗战

    相较于阿里、京东等电商老大哥在AI大模型布局上的如火如荼,有黑马之称的拼多多却失声了。拼多多不仅在AI大模型上没有大动作,即便是在国内外公司热火朝天接入Deepseek的当下,拼多多也“稳如泰山”,丝毫没有要凑热闹的意思。拼多多能否再次上演一场“后来居上”的奇袭?没人知道答案。