据证券时报报道,今日,美图公司在人工智能展会VALSE2019 新上线了美图AI开放平台。据介绍,该平台依托于美图影像实验室(MTlab),聚焦人脸技术、人体技术、图像识别、图像处理、图像生成五大技术领域,目前已服务于医疗美容、美妆门店、智能硬件、移动互联网等业务场景,与丝芙兰、屈臣氏、百度网盘、联想、中国电信、腾讯动漫、淘宝网等企业达成合作。
(举报)
据证券时报报道,今日,美图公司在人工智能展会VALSE2019 新上线了美图AI开放平台。据介绍,该平台依托于美图影像实验室(MTlab),聚焦人脸技术、人体技术、图像识别、图像处理、图像生成五大技术领域,目前已服务于医疗美容、美妆门店、智能硬件、移动互联网等业务场景,与丝芙兰、屈臣氏、百度网盘、联想、中国电信、腾讯动漫、淘宝网等企业达成合作。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯内容开放平台在北京发布公告,针对个别MCN及作者发布大量违规“AI洗稿”内容的现象,宣布将采取严厉措施,保障平台正常内容生态及原创作者权益。平台巡查发现违规行为严重影响了内容生态的健康发展。腾讯内容开放平台的这一举措受到了广泛关注,业界普遍认为,这对于整个内容创作生态都具有积极的促进作用,也将为内容行业的发展提供更加清朗的环境和规范。
美图公司旗下视频编辑软件Wink近期对其“AI动漫”功能进行了全面升级。该功能能够迅速将短剧作品转化为动漫风格效果非常精准和细腻。这一技术的引入,不仅减少了用户平均等待时长和片段闪缩等问题让用户在创作过程中更加自如,视频生成效果更加流畅。
“美图是一家AI公司”,美图在2023年财报的一开头就迫不及待地重申了自己的“新身份”。这背后源于美图去年到现在对AIGC的一连串疯狂押注。站在Adobe的肩膀上,美图能否更具有竞争力,彻底跳出“工具自卑”的怪圈需市场说了算。
近期爆红的Kimi让大模型再度成为AIGC产业瞩目的焦点。国信证券的调研显示,从2023年10月到2024年3月,Kimi的DAU从10万攀升到了300多万,翻了30倍。大模型技术与应用的结合正在开启一个全新的商业时代,即便爆火如Kimi,也需要不断创新和探索,找到适合自己特点和行业需求的大模型应用路径,进在AIGC行业浪潮中站稳脚跟。
腾讯广告一站式AI广告创意平台“腾讯广告妙思”上线图生图能力。通过上传一张参考图,妙思的AI模型便能迅速生成相似图片,实现所见即所得,让创意素材焕发新生。在游戏行业和网服行业中,CTR分别提升了19%和18%,展现出强大的市场竞争力。
微盟集团“SaaSAI”布局有了最新进展。微盟旗下AI应用产品微盟WAI与微盟BI产品进一步打通,带动微盟BI产品能力全面升级,实现了业界具有竞争力的“自然语言模糊数据查询”功能,并配套了图表输出能力,为企业对经营数据进行分析提供了有力的工具和低门槛的方法。WAIBI的成功应用,也为微盟“SaaSAI”的深入布局打下良好样本,微盟AI大模型的商业化落地应用前景可期。
广交会历来被视为中国外贸的“风向标”和“晴雨表”。近日在广州闭幕的第135届广交会一期,从展品结构、到会采购商人数等方面展现了“中国制造”新气象,释放出了新信号。PingPong福贸将继续以全球收付为建设目标,不断开拓业务版图和服务版图,以更高质量更多元更高效的全球收付服务,助力更多的外贸企业“走出去,抢订单”。
在全球化商业版图的浩瀚海洋中,企业如同一艘勇敢的船只,突破重重阻碍,勇往直前。在这一征途中,监控观测活动是导航中的指南罗盘,确保企业航向正确、安全稳定,成为企业出海路上维护业务稳定和数据安全的关键决策工具。然而,不合规的监控观测方案,就如同海上的暗礁,成为企业出海路上的致命绊脚石。随着企业跨越国界、开拓新市场,他们必须面对截然不同�
快科技4月22日消息,科大讯飞披露2023年报,报告显示,公司全年实现营业收入196.5亿元,同比增长4.41%,其中Q4同比增幅明显回升,达到14%;当期归母净利润为6.6亿元,同比增长17.12%。业务方面,开放平台与消费者业务全年营收达61.9亿元,同比增长33.4%,占总营收的比重为31.47%,这也是该业务营收占比首次超过30%,成为科大讯飞最大的业务板块。值得注意的是,星火大模型的发布推动了科大讯飞开发者生态的蓬勃发展,截至报告期末,讯飞开放平台已开放647项国际领先的AI能力及方案,聚集超过578万开发者团队,同比增长52%。自5月6日星火大
4月2日,以“全栈AI 赢定未来”为主题的2024/25财年联想中国区誓师大会政企业务群分会在北京联想总部举行。联想集团副总裁、联想中国政企业务群总经理王立平表示,在联想集团开启第五个10年的关键时刻,联想中国政企客户业务群将以全栈AI能力,深耕行业细分市场,开启新征程。如今,以生成式AI为代表的AI技术呈现爆发式突破,产业加速变革,客户对一站式智能化的产品
Lyrebird Health通过AI技术监听、学习并生成医疗文档,帮助医生在几秒钟内轻松生成记录和文档。它可以学习医生的风格和用词,并根据需要生成各种文档。Lyrebird Health还提供数据加密和隐私保护,以及定制化的记录风格和语言。
风平 IP 智造平台是基于 AIGC 的智能化 IP 打造平台,致力于提供虚拟数字人定制、AI 短视频内容生产和数字人直播的一站式解决方案。通过结合领先的 AI 技术,平台实现了数字人的高质量生产和互动能力,为用户打造全新的数字人 IP 体验。
赛灵力虚拟数字人工厂致力于 2D 虚拟人、3D 虚拟人、声音克隆等 AI 技术探索和产业应用,为企业、政府、个人提供虚拟数字人 AI 视频创作、个人形象定制、声音定制、智能语音合成等服务。
硅基智能是一款数字化虚拟人与 AI 技术相结合的产品,主要应用于智能交互领域。其主要优点包括领先的 AI 技术、智能交互体验、商业化场景应用等。
星火网文助手是一款 AI 创作辅助工具,提供创作灵感、润色续写等功能,帮助作家更高效地写作。背靠强大的 AI 技术支持,定位于提升小说写作体验,提高作品质量。
商汤日日新 SenseNova 大模型体系提供多种大模型及能力,助力各行业智能化创新,以大算力引领通用人工智能发展。
Khroma 利用人工智能学习您喜欢的颜色,并为您创建无限的调色板,帮助您快速发现、搜索和保存色彩组合。Khroma 的个性化算法训练神经网络,生成您喜欢的颜色,过滤您不喜欢的颜色。同时,还可以搜索和保存颜色组合,并获取颜色名称、hex 代码、RGB 值、CSS 代码以及 WCAG 辅助功能评分。
笔灵 AI 写作是一款专业的 AI 论文写作助手,通过人工智能技术帮助用户撰写高质量的论文。其主要优点包括快速生成论文大纲、节省写作时间、提供各类论文模板和服务。产品定位于提高论文写作效率和质量,适用于学生、研究人员等写作需求。
IDM-VTON是一种新型的扩散模型,用于基于图像的虚拟试穿任务,它通过结合视觉编码器和UNet网络的高级语义以及低级特征,生成具有高度真实感和细节的虚拟试穿图像。该技术通过提供详细的文本提示,增强了生成图像的真实性,并通过定制方法进一步提升了真实世界场景下的保真度和真实感。
PhotoMagic 是一款使用人工智能技术的图片处理工具,通过简单操作即可快速生成商业级图片。其主要优点包括快速高效、大幅降低图片处理成本,定位于帮助用户在电商等场景下快速生成吸引人的图片。
京东羚珑是一站式内容生产与管理服务平台,提供商品主图设计、广告 banner 设计、店铺首页设计等功能。其主要优点包括丰富的模板选择、免费设计服务、高效便捷的操作流程。产品定位于为商家提供设计合作伙伴服务。
Overleaf 是基于 LaTeX 的在线协作编辑器,无需安装,支持实时协作、版本控制、数百种 LaTeX 模板等。适用于科学和技术领域的文档写作。
Continue是一个专为软件开发者设计的开源IDE扩展,它通过提供自动化和智能化的工具来加速AI软件的开发流程。它允许开发者在构建软件时保持流畅的工作状态,通过插件和系统整合,轻松开始并加速开发过程。Continue支持多种编程语言的代码自动完成,提供代码段的重写功能,并允许通过自然语言指令来优化代码。它还支持与多种AI模型和开发环境的整合,使得开发者能够构建一个随着新功能出现而进化的软件系统。
Cohere Toolkit是一个开源的AI应用程序开发工具包,它提供了一套生产就绪的应用程序,可以在云服务提供商上部署。这些应用程序可以访问Cohere的Command、Embed和Rerank模型,并且可以连接到企业数据和特定团队,以提高生产力。该工具包包含用于构建独特应用程序并可扩展部署的组件。
Bunny 是一系列轻量级但功能强大的多模态模型,提供多种即插即用的视图编码器和语言主干网络。通过从更广泛的数据源进行精选选择,构建更丰富的训练数据,以补偿模型尺寸的减小。Bunny-v1.0-3B 模型在性能上超越了同类大小甚至更大的 MLLMs(7B)模型,并与 13B 模型性能相当。
llava-llama-3-8b-v1_1是一个由XTuner优化的LLaVA模型,它基于meta-llama/Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336,并通过ShareGPT4V-PT和InternVL-SFT进行了微调。该模型专为图像和文本的结合处理而设计,具有强大的多模态学习能力,适用于各种下游部署和评估工具包。
ID-Animator是一种零样本人类视频生成方法,能够在不需要进一步训练的情况下,根据单个参考面部图像进行个性化视频生成。该技术继承了现有的基于扩散的视频生成框架,并加入了面部适配器以编码与身份相关的嵌入。通过这种方法,ID-Animator能够在视频生成过程中保持人物身份的细节,同时提高训练效率。
HiDiffusion是一个预训练扩散模型,通过仅添加一行代码即可提高扩散模型的分辨率和速度。该模型通过Resolution-Aware U-Net (RAU-Net)和Modified Shifted Window Multi-head Self-Attention (MSW-MSA)技术,动态调整特征图大小以解决对象复制问题,并优化窗口注意力以减少计算量。HiDiffusion能够将图像生成分辨率扩展到4096×4096,同时保持1.5-6倍于以往方法的推理速度。
Snowflake Arctic 是一款专为企业级人工智能任务设计的大规模语言模型(LLM),它在 SQL 生成、编码以及指令遵循等基准测试中表现出色,即使与计算预算更高的开源模型相比也毫不逊色。Arctic 通过其高效的训练和推理,为 Snowflake 客户以及广大 AI 社区提供了一种成本效益极高的定制模型创建方式。此外,Arctic 采用 Apache 2.0 许可,提供无门槛的权重和代码访问,并通过开源数据配方和研究洞察,进一步推动了社区的开放性和成本效益。
OpenVoice V2是一款文本到语音(Text-to-Speech, TTS)的模型,它在2024年4月发布,包含了V1的所有功能,并进行了改进。它采用了不同的训练策略,提供了更好的音质,支持英语、西班牙语、法语、中文、日语和韩语等多种语言。此外,它还允许商业用途的免费使用。OpenVoice V2能够精确地克隆参考音调色彩,并在多种语言和口音中生成语音。它还支持零样本跨语言语音克隆,即生成语音的语言和参考语音的语言不需要在大规模多语种训练数据集中出现。