首页 > 业界 > 关键词  > 正文

HiDream.ai创始人梅涛:做视觉生成模型比扎堆做 LLM 机会更大

2023-07-21 17:44 · 稿源:站长之家

站长之家(ChinaZ.com)7月21日 消息:近日, HiDream.ai创始人梅涛在接受AI科技评论采访时表示,做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大。

据悉,梅涛曾在微软和京东工作多年,积累了丰富的技术和商业经验。他创办 HiDream.ai 的目标是在视觉基础模型领域超越国外的 Stable Diffusion 和 Midjourney,并实现全球市场的影响力。

image.png

梅涛坚持做基础模型的原因是,没有自己的模型就没有核心壁垒,而依赖开源或他人的模型则缺乏技术独立性。他对标 Midjourney 和 Stable Diffusion,认为在视觉生成模型领域还有很大的机会。目前 HiDream.ai 已经在开发一个生成式视觉多模态基础模型,旨在支持文生图、文生视频、图生视频以及文生3D 等功能。

梅涛强调数据对于大模型的重要性,他们已经积累了60亿的数据,且有自有数据集,相比于 Midjourney 等公司,他们并不落后。他们的产品将于七八月份发布,并首先面向设计师市场,提供高质量的视觉内容生成。

在讨论开源的问题上,梅涛认为开源对于技术公司来说是一个重要的参与方式,但也要考虑如何与开源社区共存和相互成长。他们计划将一些研究算法和与核心产品有差异的内容开源,为社区做出贡献。

总之,本文展示了 HiDream.ai 的创业经历和发展计划,以及梅涛对于视觉基础模型领域的发展机会的看法。他们对标国外公司,致力于打造一个具有全球影响力的创新型公司。

举报

  • 相关推荐
  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频”

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 搜狐创始人张朝阳:如果晚生30年自己也会卷入AI

    5月18日,在2025搜狐科技年度论坛上,搜狐创始人张朝阳、清华大学教授张亚勤和猎豹移动CEO傅盛展开激烈思辨。张朝阳表示若晚生30年将投身AI领域,指出当下是物理与生物世界融合的时代,年轻人应追逐风口试错。傅盛认为中国在AI工程化落地和应用创新上具备潜力,尤其在智能体等场景可能反超。张亚勤强调人才厚度是核心竞争力,中国AI人才数量是美国的5倍左右。张朝阳总结称中国人聪明勤奋,加上人口优势和激烈竞争,中国在AI及科技各领域正追赶甚至超越,包括芯片和算力问题。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 宇树科技创始人王兴兴:AI将深刻改变教育 但不会取代教师

    2025世界数字教育大会在武汉召开,宇树科技创始人王兴兴指出AI技术已实现从基础识别到认知智能的重大突破,正深刻改变教育格局。AI通过个性化学习算法提供定制化知识服务,打破传统单向教学模式,构建"个体-工具-环境"三位一体的教育新生态。研究显示AI在智能辅导、自适应学习等场景应用优势显著。王兴兴强调需关注数据隐私与伦理规范问题,同时推动教师角色向学习领导者转型。宇树科技未来将重点打造开放平台,推动AI与教育资源的开源共建,建设全球化教育技术生态,并加强跨学科实验室建设和青少年AI培养。

  • 男女友一起来?知名恋爱手游创始人押注AI陪伴下半场

    文章介绍了国内AI伴侣产品的最新发展动态,重点分析了《奇点时代》衍生APP"奇点Chat"和3D AI男友"EVE"两款产品。其中"奇点Chat"主打真实情感陪伴体验,通过剧情动画、记忆系统、日常互动等功能模拟真实恋爱关系;而"EVE"则推出男性向AI伴侣,PV播放量达35万次。文章对比了两款产品的市场表现,指出AI女友产品热度普遍高于AI男友。同时深入剖析了"奇点Chat"的特色功能设计,包括拟真聊天界面、天气提醒、新闻播报等生活化交互,以及68元/月的订阅模式。最后探讨了AI陪伴产品面临的商业化困境,认为建立长期情感连接可能是该品类的突破方向。

  • 仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

    只需三张输入图像,Matrix3D 就能生成物体、甚至整个环境的详细 3D 重建,这显然可以为 Apple Vision Pro 等沉浸式头显带来非常有趣的应用……

  • Steam创始人G胖创业最新进展:首款脑机芯片今年就推出!

    Valve创始人Gabe Newell创立的脑机接口公司Starfish Neuroscience宣布,计划年底推出首款脑机接口芯片。该芯片体积仅2x4mm,功耗1.1毫瓦,支持无线充电,拥有32个电极位点和16个记录通道。相比现有产品,其特点是能同时连接多个脑区,无需电池运行,侵入性更低。公司表示该技术对治疗帕金森等神经系统疾病具有重要意义,目前正积极寻找合作伙伴开发新应用。早在2019年,G胖就秘密成立了这家公司,并曾在游戏开发者大会上探讨过脑机接口的游戏应用可能性。

  • 发布AI Agent开发平台,AI生态… 网易数智接下来这么干

    AI时代正从AIGC转向AI Agent发展。微软CEO纳德拉预测AI Agent将成为新应用,Gartner预计到2028年超1/3企业软件将集成AI Agent功能。网易数智发布CoreAgent智能体开发平台及多款行业智能体,助力企业快速落地AI应用。文章指出当前AI Agent面临技术门槛高、场景适配难等挑战,网易提出"技术共生、市场共拓、利润共享"的生态协同理念,强调AI需要与行业know-how结合才能创造真实价值。网易数智宣布品牌升级,从"科技蓝"变为"网易红",展现拥抱AI时代的决心。

  • 快手可灵AI上线2.1系列模型生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。