首页 > 业界 > 关键词  > 站长之家最新资讯  > 正文

每周AI大事件 | OpenAI或为AI建应用商店、美图发布视觉大模型、腾讯云行业大模型新进展

2023-06-25 09:25 · 稿源:站长之家

欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。

机器人手指 人工智能

Part1动态

[国内要闻]

腾讯云公布行业大模型进展

腾讯云披露行业大模型方案进展,并公布MaaS(Model-as-a-Service)能力全景图。其基于企业痛点和需求,依托腾讯云TI平台打造的行业大模型精选商店,提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。

商汤国产中文大模型全面领先ChatGPT

商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。商汤科技自研中文语言大模型名为商量SenseChat2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。

长虹电视大模型“长虹超脑”正式发布

长虹电视旗下大模型“长虹超脑”正式发布,具备感知、理解、创造三大核心能力。同时,长虹推出了全球首台人工智能电视、发布了全球首款多模态交互电视、实现了全球首个电视交互的免唤醒能力。

快影内测多款AIGC新功能

快手旗下的视频剪辑类产品“快影”和功能拍摄类产品“一甜相机”,已于近期陆续内测包括“AI动漫视频”、“AI文案推荐”、“AI瞬息宇宙”、“AI简笔画“在内的多款AIGC创作功能。

美图发布视觉大模型MiracleVision

美图公司发布了“懂美学的AI视觉大模型”MiracleVision(奇想智能),为行业客户提供AI视觉解决方案,并与创作者和开发者共建模型生态。

印象笔记开放印象AI使用次数限制

印象笔记开放“印象AI”使用次数限制。据悉,“印象AI”基于印象笔记自主研发的轻量级大语言模型“大象GPT”,并结合国内外大语言模型的混合模型方案,为用户提供开放式写作助手等功能。

腾讯云将推出面向行业的大模型

据科创板日报报道,腾讯云将在“行业大模型及智能应用技术峰会”公布腾讯云在行业大模型方面的技术方案,以及智能应用升级和产业客户场景的应用进展。重点是面向行业大模型的应用落地,而非聊天助手类产品。

视频号:深度合成技术生成音视频内容需进行显著标识

视频号发布了关于创作者规范使用深度合成技术生成内容的建议,要求创作者应对使用虚拟现实、深度合成技术等生成或合成的非真实的音视频内容进行显著标识。

阅文集团成立“智能与平台研发事业部”

阅文集团CEO侯晓楠发布全员内部信称,将成立重点项目组集中攻坚AIGC技术及其场景应用,让技术能力成为创作者们的强大助力,成为内容生态平台升级的加速器。

金山办公:“WPS AI”相关功能将逐步上线

“WPS AI”相关功能将逐步上线,有望全面赋能公司全线产品。金山办公董事长邹涛说,AI是金山办公重要的产品战略之一,当前公司选择“两条腿走路”,首先会选择和AIGC 、大型语言模型相关的技术服务商合作,通过他们的技术赋能来进行产品研发;同时也在持续接触一些优秀的创业公司。

百家云发布AIGC产品“市场易”大模型

百家云召开线上发布会,发布了业内首款适用于企业市场部内容生产场景的GPT大模型引擎“市场易”。市场易支持SaaS订阅,首家26800元/年,并支持定制私有化部署,无需调用外部模型。

[国际要闻]

GPT-4最新创造力测试GPT4排名前1%

最新研究发现,GPT-4的创造力全方位持平或碾压人类。最近,一项有关GPT-4的创造力思维测试火了。来自蒙大拿大学和UMWestern大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1%。

特斯拉AI账号悄然上线

特斯拉最近上线了一个新的推特账号Tesla_AI”,并发布了几条推文,介绍了特斯拉在人工智能方面的进展。一些推文称,特斯拉正在打造自主机器人的基础模型。我们的多模态神经网络已经安装在客户车辆上,这些网络采用任意模式,如摄像头视频、地图、导航、惯性测量单元(IMU)、GPS等。

StableDiffusion模型发布新版本:生成图像以假乱真

StabilityAI官方宣布,推出SDXL0.9版本更新,对StableDiffusion进行了优化。与此前的SDXLBeta相比,新版本下的StableDiffusion模型在图片的生成上有着更为明显的优势。

OpenAI考虑为AI创建应用程序商店

OpenAI计划推出一个应用商店,允许开发者在其自家的人工智能技术之上构建的AI模型进行销售。

超50%使用AI的企业反馈了积极的成果

在Omdia的一项新调查中,超过一半的受访者表示,,他们使用人工智能来降低成本和提高效率的结果是积极的。

GitHub调查:92%的程序员正在使用人工智能

GitHub进行了一项调查,旨在了解有多少程序员正在使用AI工具。结果显示,500名接受调查在美国工作的开发人员中有92%的人表示已经将AI工具整合到了工作中,而70%的人表示这些工具为他们的工作带来了“优势”。

Snap发布SnapFusion:手机生成式AI图像速度缩短至不到两秒

Snap宣布其SnapResearch部门研发出一项新技术,可加快生成式AI艺术创作生成图像的速度。Snap称该新方法为SnapFusion,将通过生成式AI制作图像的时间缩短至不到两秒。他们声称这是「迄今为止学术界发布的最快速度」。

谷歌推出TryOnDiffusion生成式AI试穿功能

谷歌推出了一项由人工智能驱动的虚拟试穿功能,让购物者可以在各种模特身上看到服装的效果。

与ChatGPT对话足以辅助设计CPU

纽约州立大学(NYU)的一个研究团队完成了一项看似不可能的任务:他们成功设计了一款没有硬件定义语言的半导体芯片。他们仅仅使用了简单的英语,通过其中的定义和示例来定义和描述半导体处理器,展示了人类的聪明才智、好奇心和基础知识在与ChatGPT的AI能力相结合时所能实现的惊人成就。

美国最大报纸出版商涉足生成式AI

出版集团Gannett计划在其用于发布新闻的系统中引入生成式人工智能,这将有助于节省资金并提高效率。然而,该公司表示将确保在使用技术时不会自动部署,而是需要人工监督。

GPT-4满分通过MIT本科数学考试

GPT-4在MIT的数学和EECS(电气工程和计算机科学系)本科学位考试中,表现出的能力完全满足毕业要求。而且妥妥地拿下满分!

Part2热门产品

GPT-Engineer:一个提示生成整个代码库

动嘴写代码指日可待!AI代码生成明星项目GPT-Engineer一夜爆火,短短几天狂揽19k星。这是一个根据指示生成代码的AI工具,你只需要「动动嘴」,就能直接构建整个代码库。甚至,它能学习你的代码风格,短短几分钟就能让你搞定编码项目。

LG推CaptioningAI:10秒内为图片提供5句描述和10个关键词

LG发布了一款名为CaptioningAI的生成式AI服务。LG介绍,CaptioningAI基于零次学习技术,使AI可以像人类一样利用其先前积累的经验和知识来解释它第一次看到的物体或场景。平均而言,该服务能在10秒内为一张图片生成5个完整的描述性句子和10个关键词。

Deepmind的新AI算法用两个小时学习了26个游戏

日前,Deepmind的一个名为"Bigger,Better,Faster"的AI算法,在只用了两小时的时间内掌握了26个Atari游戏,与人类效率水平相当。这个不需要预先训练模型的算法达到了人类学习的效率,并且需要的计算能力比旧方法少得多。无模型代理直接从与游戏世界的交互中获得奖励和惩罚的信息,并学最佳策略。

普林斯顿大学推3D场景生成模型Infinigen

普林斯顿大学研究人员AlexanderRaistrick日前发布了一款名为“Infinigen”的开源AI模型,可以帮助人们生成逼真的3D场景。Infinigen是一款基于开源建模软件Blender的免费开源模型,能够通过随机数学规则生成一系列自然界的“植物、动物”场景,并且可以通过输入提示词来自定义地形,并添加“云、雨、雪、雷暴、天火”等自然现象。

Meta机器学习模型Voicebox:可从文本生成语音

日前,Meta平台的人工智能研究部门推出了名为Voicebox的机器学习模型,可以将文本转换为语音。与其他文本转语音模型不同的是,Voicebox能够执行许多未经过训练的任务,包括编辑、去除噪音和样式转换。Voicebox是一种生成模型,可以在英语、法语、西班牙语、德语、波兰语和葡萄牙语等六种语言中合成语音。

Part3观点

阿里陈龙:现阶段的AI,还处于工具和内容阶段

阿里巴巴集团战略规划总裁陈龙表示,现阶段的AI,还处于工具和内容的阶段,大家都在认真地学习,未来更AI原生的一些新兴产业和工作会大幅度增加。

刘慈欣谈ChatGPT:人类的无能反而是人类最后的屏障

刘慈欣最近在一次活动中表达了自己对以ChatGPT为代表的人工智能可能会给人们带来的影响,回答了人工智能是否会消灭人类的问题。第一个层次就是这种字面意义上的消灭,就是人工智能用某种暴力从肉体上完全消灭人类或是统治世界。一个有很讽刺意义的一件事情:我们人类的无能反而成为我们一个最后的屏障。

阿里张勇谈人工智能:会让旧行业消失,但新行业也会出现

在谈及人工智能带来的挑战时,张勇表示,“人工智能的发展可以类比移动互联网,目前所有行业,包括制造业、交通业、金融业等,都会在AI加持下不断升级,虽然有一些行业和岗位会受挫,但随着技术的不断落地,旧的行业消失,新的行业也会出现。”

杨立昆:生成式AI还不如狗聪明这不应被视为威胁

Meta首席人工智能科学家杨立昆表示,目前像ChatGPT这样的AI系统并不具备人类水平的智能,生成式AI系统甚至不如狗聪明。尽管未来会出现比人类更聪明的机器,但这并不应该被视为威胁。

马斯克:呼吁暂停先进AI开发的公开信并没有人会同意

马斯克表示:「我实际上并没有认为会有人同意这个暂停。但我是想,为了提醒大家记住也要说,『我认为我们应该暂停』」。

Part4深度

ChatGPT也涨不动了

前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。

AI,正在疯狂污染中文互联网

污染中文互联网,AI成了“罪魁祸首”之一。AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。

用AI经营一家三明治店,还“白嫖”了小红书探店博主

用AI经营餐饮店是一种什么体验?小红书博主“车达|王同学”(以下简称王同学)和朋友们一起开了家三明治店,原本自己做的三明治看起来平平无奇,根据AI的建议重新制作、升级包装后,一下就有网红三明治内味了!

CEO们,患上“AI焦虑症”

AI浪潮席卷而来之时,时刻瞄准商机的公司CEO们,更是既兴奋、又焦虑,兴奋的是新变革意味着新机遇,同时他们也焦虑在这一场巨变中会被落下。他们焦虑方向的选择,更焦虑落地场景。他们短期内希望AI能够降本增效,但长期来看,更寄希望于把AI当成新的增长驱动力。

举报

  • 相关推荐
  • 大家在看
  • MediaTek Dimensity 9400:下一代旗舰智能手机芯片

    MediaTek Dimensity 9400是联发科推出的新一代旗舰智能手机芯片,采用最新的Armv9.2架构和3nm工艺制程,提供卓越的性能和能效比。该芯片支持LPDDR5X内存和UFS 4.0存储,具备强大的AI处理能力,支持先进的摄影和显示技术,以及高速的5G和Wi-Fi 7连接。它代表了移动计算和通信技术的最新进展,为高端智能手机市场提供了强大的动力。

  • Stager AI:一键式虚拟家居布置和图片编辑器

    Stager AI是一个为房地产行业设计的虚拟家居布置和图片编辑器,利用人工智能技术帮助用户快速、轻松地提升房产图片的吸引力,从而提高房产的在线展示效果和销售转化率。它支持一键式虚拟布置、图片增强、地板更换、墙面粉刷、草坪替换和天空替换等功能,无需用户具备专业的图片编辑技能。Stager AI旨在帮助房地产经纪人、摄影师和Airbnb房东等用户群体,通过提升房产图片的专业度来吸引更多潜在买家或租客。

  • 小虫快读:高效OCR阅读工具,快速获取书籍精华。

    小虫快读是一款基于OCR和AI大语言模型的高效阅读工具,通过手机相机拍摄书籍页面,利用先进的OCR技术自动识别文字,AI大语言模型几秒内生成书籍的核心内容和精华总结,并通过AI语音播放功能,让用户轻松听书,解放双眼,提升学习效率。

  • Podial:将文件转换成引人入胜的播客讨论,轻松学习复杂主题。

    Podial是一个创新的教育技术平台,它允许用户将文档转换成播客形式的讨论,使得学习复杂主题变得更加容易和有趣。这个平台特别适合那些希望以不同方式吸收信息的用户,无论是为了个人发展还是专业提升。Podial通过其独特的方法,将传统的阅读材料转化为互动性强、易于消化的音频内容,从而提高了学习效率。

  • Dashworks Bots:创建定制的AI搜索助手,满足团队需求。

    Dashworks Bots 是一款专为企业团队设计的AI助手,能够连接知识源并提供精确答案,以提高工作效率和信息检索的准确性。它支持多种语言,符合多种隐私和安全标准,如SOC 2 Type II、HIPAA和GDPR,确保数据安全。

  • AiPPT国际版:一键生成演示文稿

    AiPPT是一个AI驱动的演示文稿制作工具,它通过简化演示文稿的创建过程,帮助用户快速生成专业的演示文稿。它支持将文档转换成PowerPoint或Google幻灯片,提供丰富的模板和一键生成演示文稿大纲的功能,极大地提高了工作效率。AiPPT特别适合需要频繁制作演示文稿的商务人士、教育工作者和学生。

  • Selfletter:AI助手,将复杂目标分解为简单任务

    Selfletter是一个利用人工智能技术帮助用户将复杂的目标分解成简单任务的工具。它能够根据用户的目标和时间安排,生成详细的日历计划,并通过邮件提醒用户每日任务。产品的主要优点包括个性化任务生成、从过往经验中学习、美观的邮件设计以及低成本。Selfletter适合那些需要帮助规划和执行复杂任务的用户,无论是个人目标、商业计划还是教育项目。

  • Lumigator:AI模型选择助手

    Lumigator 是 Mozilla.ai 开发的一款产品,旨在帮助开发者从众多大型语言模型(LLM)中选择最适合其特定项目的模型。它通过提供任务特定的指标框架来评估模型,确保所选模型能够满足项目需求。Lumigator 的愿景是成为一个开源平台,促进道德和透明的AI开发,并填补行业工具链中的空白。

  • Haiva Analytics Agent:实时数据分析,提升决策效率。

    Haiva Analytics Agent 是一款提供实时数据洞察的分析工具,通过连接多个数据库和第三方应用程序,为企业提供即时访问关键信息的能力,帮助团队做出更快、更明智的决策。支持多种图表类型,简化数据可视化,帮助企业轻松识别趋势和机会。自动化常规分析任务,通过无需编码的自助服务平台获取更深入的洞察,确保企业保持敏捷、数据驱动和领先于竞争对手。

  • Trillion:轻松管理您的财务,跟踪支出,设定预算。

    Trillion是一款个人财务管理应用,它可以帮助用户跟踪支出、管理多个账户、设定财务目标。它具有智能AI分类、多货币和多账户管理功能,支持多种语言,适合频繁旅行者和国际用户使用。Trillion提供详细的财务报告和交互式图表,帮助用户理解消费习惯,做出更明智的决策。

  • devActivity:提升软件开发体验的数据分析工具

    devActivity是一个为软件工程团队提供数据驱动的性能评估、AI驱动的回顾洞察、贡献和工作质量分析以及操作瓶颈警报的工具。它基于提交/拉取请求/代码审查/问题/评论事件,旨在通过提供可操作的洞察和吸引人的游戏化功能来增强软件工程项目。

  • SEO Keyword Strategist:高效识别关键词,提升内容营销和搜索排名

    SEO Keyword Strategist 是一个专注于内容营销和SEO关键词策略的智能代理。它通过分析搜索意图和竞争对手数据,帮助用户识别高影响力的关键词,从而规划有效的内容策略,提高博客和着陆页的搜索排名。该产品主要面向需要提升在线可见度和搜索排名的企业和个人。

  • Censorfy:AI驱动的即时内容审核服务

    Censorfy是一个利用人工智能技术进行即时内容审核的平台,它能够对文本和图像进行审核,确保内容的合规性。该服务通过一个HTTP请求即可完成,为用户提供高效、准确的内容审核解决方案。Censorfy的主要优点包括高效率、低成本和易用性,适合需要快速审核大量内容的企业和个人使用。

  • PimEyes:反向图片搜索和面部识别搜索引擎

    PimEyes是一个利用面部识别技术提供反向图片搜索服务的网站,用户可以通过上传照片来查找互联网上与该照片相似的图片或个人信息。这项服务在保护隐私、寻找失踪人口以及版权验证等方面具有重要价值。PimEyes通过其先进的算法,为用户提供了一个强大的工具,以帮助他们在网络上查找和识别图像。

  • Tilores Identity RAG:客户数据统一与检索平台

    Tilores Identity RAG 是一个为大型语言模型(LLMs)提供客户数据搜索、统一和检索服务的平台。它通过实时模糊搜索技术,处理拼写错误和不准确信息,提供准确、相关且统一的客户数据响应。该平台解决了大型语言模型在检索结构化客户数据时面临的挑战,如数据来源分散、搜索词不完全匹配时难以找到客户数据,以及统一客户记录的复杂性。它允许快速检索结构化客户数据,构建动态客户档案,并在查询时提供实时统一且准确的客户数据。

  • Mermaid Whiteboard:终极AI、Mermaid和可视化制图套件

    Mermaid Whiteboard是一个基于文本的制图工具,由获奖的开源项目Mermaid JS背后的团队开发。它允许用户通过文本创建各种图表,包括流程图、序列图、甘特图等。Mermaid Chart通过简化文档流程、提高工作流程和团队间的沟通效率,为系统设计和新团队成员的培训带来了革命性的变化。

  • Inflection AI for Enterprise:企业级AI系统,定制化智能解决方案。

    Inflection AI for Enterprise是一个围绕多亿级终端大型语言模型(LLM)构建的企业AI系统,允许企业完全拥有自己的智能。该系统的基础模型经过针对业务的微调,提供以人为中心、富有同理心的企业AI方法。Inflection 3.0使团队能够构建定制的、安全的、员工友好的AI应用程序,消除了开发障碍,加速了硬件测试和模型构建。此外,Inflection AI与Intel AI硬件和软件结合,使企业能够根据品牌、文化和业务需求定制AI解决方案,降低总体拥有成本(TCO)。

  • Jazon:AI驱动的电子邮件生成器,提高转化率。

    Jazon是一个AI驱动的电子邮件生成器,能够帮助用户撰写高效、个性化的电子邮件,从而提高潜在客户的转化率。它通过AI技术自动生成邮件内容,学习用户习惯,并持续优化邮件策略。Jazon的主要优点包括:提升邮件回复率、节省撰写时间、以及通过数据分析来优化邮件效果。Jazon适合需要大量撰写商务邮件的销售人员和市场推广人员使用。

  • NVLM 1.0:前沿级多模态大型语言模型

    NVLM 1.0是NVIDIA ADLR推出的前沿级多模态大型语言模型系列,它在视觉-语言任务上达到了业界领先水平,与顶级专有模型和开放访问模型相媲美。该模型在多模态训练后,甚至在纯文本任务上的准确性上也有所提高。NVLM 1.0的开源模型权重和Megatron-Core训练代码为社区提供了宝贵的资源。

  • Pogo:旅行规划的智能助手

    Pogo是一个专为旅行规划设计的应用程序,它通过简洁美观的界面和功能强大的工具,帮助用户发现、规划和协作旅行计划。Pogo提供个性化的AI行程规划和会员折扣,让用户的旅行规划更加轻松。

今日大家都在搜的词: