站长之家首页 > 传媒 > 来攒台最新资讯 > 正文

来攒台能跑深度神经网络的机器吧|Open Talk No.33

2017-06-30 10:55 · 稿源:站长之家用户投稿

2017 年 6 月 24 日,又拍云旗下技术沙龙 Open Talk 来到人工智能公司最为集中的城市之一——深圳,探讨了“大数据和机器学习最佳实践”这一热门话题;阿基米公社的活动现场挤满了被话题吸引来的观众。

大数据、机器学习已经成为研究人工智能不能或缺的两大要素,本次Open Talk的讲师来自华为、数果科技、又拍云等公司在大数据、机器学习领域颇有实战经验的工程师,分享了各自业务在大数据、机器学习方面的实践经验,深受现场观众认可。此次Open Talk由IT大咖说提供直播支持。

训练人工智能,如何搭配硬件?

“内容识别”是又拍云于 2017 年推出的首个人工智能产品,可应用于图片、直播、点播等场景,智能识别色情、广告、暴恐等不良内容,其中鉴黄识别率已经高达99.7%。

在Open Talk现场,负责又拍云“内容识别”开发工作的叶靖,在《又拍云的深度学习实践》的分享中,介绍了又拍云在开发“内容识别”项目的过程中,所用到的各种工具和技术,以及又拍云在人工智能方面的各种尝试,面临的挑战等。

又拍云“内容识别”的开发基于超千亿张的图片数据,以及深度神经网络,“最重要的一个工具就是GPU,GPU性能好,CPU运算速度都是 50 几毫秒,但GPU可以达到0. 17 毫秒。但GPU还有很多不足的地方,GPU对硬件依赖性很高又不易扩展,不能像内存那样扩展到 100 多G;此外还需要针对GPU重写算法,CPU的代码不能直接拿到GPU上跑,而且比较复杂。”叶靖分享了对研发“人工智能”时候的硬件选择,也介绍了其中存在的问题:“GPU从数据、内存拷贝数据的速度比较慢慢,写代码时要尽量避免内存的拷贝。”

“我们选择了 4 张 1070 显卡,配置了SSD,因为很多数据从机械硬盘读取的话严重影响训练速度。在CPU上,为了突破CPU的通道限制,我们选择了 8 核CPU* 2 的配置。在操作系统的选择上,又拍云采用了Ubuntu 16.04,一开始选择了14.04,结果出现了一大堆的问题。”叶靖好不藏私的分享内容,引起了现场观众热烈的提问。

海量用户数据的处理妙招

人工智能的训练需要大数据,面临大数据的处理也需要人工智能的参与。数果智能联合创始人、首席架构师黄强在本次 Open Talk 上分享了《海量用户行为数据的储存和分析》。

“用一句话来说,用户行为数据就是用户在产品上的操作行为的记录。”黄强高度概括了用户行为数据的含义,“其中包括了时间、地点、页面信息等信息。”一般企业的用户数到了几十万,用户一天下来做的所有的操作行为,像一个用户行为数据包含用户的IP、sessionID、imei、终端ID,这个数据量是非常庞大的,每一天就是一个App都是几百亿甚至上千亿的数据量。

这些数据里,高基数的维度很多。“我认为基数在百万以上就比较高了。”黄强认为。什么是基数?比如说用户ID有一个很大的量,一个维度下有多少个不重复的值,这种值就可以叫ID,如果基数很高,这个值会非常多。高基数产生的数据量非常庞大,几千万到上千亿都是有可能,还有用户行为是持续的。这些都是用户行为数据的处理难点。

黄强分享了用户行为数据处理环节的几个步骤:第一步是采集,通过SDK等方式、工具采集数据;采集到数据之后需要进行存储,“数据量非常大,需要拆成很多份,采用分布式资源,才能最大化利用一台设备的计算资源。”因为数据被拆散了,所以数据处理还需要加入“查询”功能,把查询结果做一个合并,输出最终结果。此外就是数据的索引,克分为倒排索引和正向索引两种方式。

数据很重要,更重要的是呈现方式和互通

华为消费者BG数据分析架构师王在清作为压轴嘉宾,带来了《数据分析与洞察》。王在清 因工作需求,从市场销售分析投入到数据分析领域,后续进入架构、数据挖掘等领域,曾参与多项跨国企业的全球BI/DW 建设工作,擅长分析物(产品、事件)与人(客户、员工)。

在活动现场,王在清主要介绍了华为消费者BG的数字化建设与数据驱动,从建立数据体系到分析洞察应用。

很多年前,许多公司都在落地信息化,建了一大堆IT系统,“但全部都是数据孤岛,数据跟数据没有什么连接。从现在回来看,这些数据开始建设的时候,就应该有一个统一的视图,借助统一的视图完善数据的关联。一开始有一个整合视图以后,还可以是数据岛,但是岛与岛的交通线是一致的,而不是事后两边各建一个桥,运气不好还建两座桥。”

王在清认为,做数据分析和做洞察,必须要基于统一的做法,“否则挖掘出来的数据没有办法解释,没有办法解释的数据就不是数据报告的结果。我们必须要先建立整体的数据视图,或许还是十几套IT系统,但是所有的数据定义是一致的。

王在清的分享当中,提出一个观点:数据只有“快速、简单、可视”才会产生价值。实现数据可视化数又可以分为三个步骤:先进入hindsight,再进入insight,最后进入foresight。

网友热搜:

免责声明:“站长之家”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。

  • 大家在看
  • 相关推荐
  • 英伟达将提供30超级电脑的算力协助科学家抗疫研究

    4月7日消息,为了更好地抗击新冠病毒,许多人都提供了自己电脑的运算力来协助相关的研究。今天英伟达也加入了此列,他们宣布自己已成为新冠病毒高性能运算联盟(COVID-19 High Performance Computing Consortium)的一员,未来会提供30台超级电脑供科学家使用,以提高抗疫研究的效率。

  • 特斯拉CEO马斯克:捐赠加州的1000呼吸机,是从中国采购

    3月24日,特斯拉CEO马斯克在上周就表示要为加州捐赠呼吸机1000台,目前这批呼吸机已经到位。马斯克通过社交平台证实了,这批呼吸机是从中国采购的,一共采购了1225台。此前马斯克表示特斯拉和SpaceX公司要打算建设呼吸机产线,来应对可能到来的需求增长,目前已和美国医疗器械公司展开商讨。

  • 保时捷回应入股蔚汽车:是购入蔚资本

    3月23日据中国网的消息,对于近日网友发现保时捷汽车合作公司里出现“蔚来”LOGO,保时捷官方回应称,并非“保时捷与蔚来汽车合作”,而是保时捷旗下风险投资公司(Porsche Ventures)向“蔚来资本”(NIO Capital)进行了投资。保时捷表示,保时捷这次便是购入了“蔚来资本”的基金,旨在加强与中国未来出行市场之间的联系。

  • 被列被执行人 蔚官方怎么回应的?

    根据天眼查数据显示,2020年3月18日,蔚来汽车的运营主体——上海蔚来汽车有限公司被上海市嘉定区人民法院列为被执行人,执行标的为1100000。对于公司被列为被执行人,蔚来汽车回应称:正常商务纠纷,尊重法院判决。

  • 积电一湾员工确诊感染新冠病毒 不会影响公司运营

    全球最大的芯片制造商台积电周三表示,其台湾办公室的一名员工新冠病毒检测呈阳性。​台积电的客户包括苹果和华为等科技巨头。该公司表示,已经加强了疾病控制,此次事件不会影响公司运营。

  • 好创意,竖着欣赏一下2019“V-UP”的优秀作品!

    众所周知,抖音拥有海量用户群体,众多MCN机构在此风生水起,品牌们也正紧锣密鼓地加快利用抖音有效实现贴合用户、走进用户的步伐,同时在全新的环境、全新的媒介形式面前,重新思考创意、定义抖音营销。在这样的情势下,“2019V-UP抖音竖屏广告创意大赛”应运而生。历时四个月,大赛圆满结束。由 10 位营销行业专业评审及代理公司高层等组成的权威评审团,评审出全场大奖以及品牌影响力、创意、视听、实效奖等 5 类共计 13 项大奖

  • 罗永浩直播间12哈弗F7卖了4就下架?官方发声明

    哈弗官方微博对此发布声明,表示 4 月 10 日晚上 10 点 27 分 18 秒罗老师宣布 12 台哈弗F7 半价车开抢,由于抖音直播口令发布与天猫货品上架存在时间差,平台切换存在系统延迟,导致客户在抢购初期看到的显示价格仍未 130000 元。

  • 华为移动路由全球出货量突破1.9亿 其中随行WiFi出货量1.5亿

    今天,在媒体沟通会上,华为宣布,截至目前,华为移动路由全球出货量已突破1. 9 亿台。其中,CPE系列全球累计出货量 4000 万台,随行WiFi系列累计出货量1. 5 亿台。前者适合家庭使用,无需宽带,插卡上网。后者适合个人出行使用,移动热点,轻巧便携。

  • 小鹏G3一季度上险量2331 仅3月就达1094

    据中国汽车研究中心数据显示,小鹏G3 今年一季度上险量 2331 台,仅 3 月就达 1094 台。 2018 年 12 月,小鹏G3 正式上市,定位紧凑型电动SUV,等速纯电续航550km。 2019 年 6 月,小鹏G3 实现 10000 辆生产。

  • 软银15年首次亏损

    日本软银集团发布了 2020 财年( 2019 年 4 月 1 日到 2020 年 3 月 31 日)的业绩预测,预计本财年经营亏损1. 35 万亿日元(约合人民币 880 亿),预计本财年净亏损 7500 亿日元。据称,这是软银 15 年来首次亏损

  • 老罗直播原定的12半价哈弗F7仅售4就下架?官方回应来了

    罗永浩此前宣布,此次共计 12 台哈弗F7 将以半价的价格开抢,而在直播过后,有网友质疑称,在以半价的价格售出 4 台后,哈弗F7 即告下架。

  • 微信聊天记录怎么恢复?专家支招

    微信聊天记录怎么恢复?微信是与我们息息相关的聊天软件,很多重要的图片、聊天内容都在。有的小伙伴粗心大意有时候会删除了记录,不过也是可以恢复的,想了解删除的微信聊天记录小技巧就看下面的方法吧!一:查看电脑端是否有备份很多伙伴应该都在电脑上登陆过微信,平时我们的聊天记录都会同步到电脑中。那要想找回删除的微信记录,直接恢复PC端微信备份即可。操作方法如下:在电脑上登录微信,然后依次点击左下方的“备份与恢复”

  • 网页设计有哪些技巧,鱼爪设计助你

    当我们打开一个网页的时候,相信很多人对于这个网页的美观度都会有一个基本的评价,有的网页设计的十分大气,有的网页设计的杂乱无章,同样都是网页,但是带给用户的视觉体验却是大不相同的,一个新奇且具有创意的网页可以让整个网站都散发出一种活力,能吸引用户在网站上花费更多时间去驻足浏览,那么如何才能做好网页设计呢?网页设计有哪些技巧?一、选择合适的配色方案色彩带来的视觉体验是非常直接的,强烈的色彩可以给人的眼球

  • 数科以金融科技强化自身,助力金融发展

    随着大数据、云计算、人工智能、区块链等前沿技术从实验转向成熟应用,金融科技开始渗透到各个关键金融环节,正改变着线上金融交易的产品形态和业务模式。作为纯线上金融科技品牌, 我来数科以大数据风控技术为核心,以人工智能技术为支持,助力整个行业快速实现金融和科技的深度融合,进一步提升国家金融行业的发展高度。而如何能让科技力量更有效地发挥,最大化地助力消费金融行业的发展,已经成为行业发展的关键。为越来越多的?

  • 马斯克:特斯拉本周将提供 1200 呼吸机

    特斯拉 CEO 马斯克在推特表示,特斯拉将在本周内完成大约 1200 台呼吸机的分发,他称,呼吸机的交付、安装和操作是其中最难的部分。上周五,马斯克表示,特斯拉和 SpaceX 的员工正在「研究呼吸机」,尽管他不认为这些机器将来会被需求。

  • 苹果中国官网限购 所有iPhone每人限购两

    3月20日,今天苹果中国官网开始对官网上正在销售的所有iPhone进行限购,每款允许每个人限制购买两台,且根据苹果其他地区官网显示,包括美国地区、欧洲地区等也开始了这项限购政策。

  • 汽车披露持股情况:CEO李斌持股比例为13.8%

    美国证券交易委员会(SEC) 4 月 14 日披露文件显示,截至 2019 年 12 月 31 日,蔚来汽车(NIO.N)董事会主席兼首席执行官李斌持有该公司154,689, 253 股具有共同投票权及共同处置权的A类普通股,占总股本的13.8%。Originalwish Limite持股6.5%;NIO Users Limited与NIO Users Trust分别持股4.5%。

  • 不会将PPT转成PDF?嗨格式PDF在线工具帮你

    PPT是一种演示类文件,可是演示效果好却兼容性差。很多伙伴会选择将一些PPT转换成PDF文件用于传阅。那么你知道怎么将PPT转成PDF文件吗?有些人是直接进行另存为的,我们打开一个PPT文件,点击左上角“文件”中的“另存为”。在另存为中,选择保存的文件格式为“PDF文件格式”即可。这个方法是简单,不过转换的效果是真的不理想。PDF方面的转换最好是借助一些专业工具。小编在找寻一圈发现,嗨格式PDF在线工具是可以完成文件格式转换

  • 2019净亏损超112亿元!李斌发声

    财报显示,蔚来 2019 汽车业务毛利率为-9.9%,较 2018 年的-1.6%有所扩大,即使排除电池召回事件的影响,这一数值仍为-6.0%。就公司整体而言,去年蔚来汽车的毛利率为-15.3%,较 2018 年的-5.2%明显扩大,排除电池召回事件影响,蔚来汽车的毛利率则为-10.9%。

  • 深度解析峡糕点的运营模式,糕点店要怎样运营?

    糕点作为一种休闲食品,带着其特有的口感一经推出就得到很多人的青睐。如今的糕点门店如雨后春笋般层出不穷,可是并非都可以发展尽如人意,究其原因和其管理模式和理念息息相关。台峡糕点 自推出以来,各门店生意兴隆,消费者络绎不绝,让许多同行者侧目。之所以台峡糕点 门店的生意可以如此稳定,和其进步、科学的管理;糕点品种细化明确、分类摆放醒目;服务体系完善,服务态度贴心关系密切。如下就台峡糕点 门店得到消费者认可的

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议

热文

  • 3 天
  • 7天