提升数据战略 铸造网络安全人工智能品牌


【摘要】人工智能将深刻改变人类社会生活、改变世界。数据是人工智能时代的重要资源。网络安全领域有丰富的“数据”,也有诸多极具挑战性的复杂课题,因此发展网络安全+人工智能的潜在价值是巨大的,任务也是艰巨的。同时网络安全与国家安全相关,各国倾力研究但少有公开。作为网络安全国家队,我们有必要在公司层面提升数据战略,深化数据思想,探索和制定数据搜集和管理方法、数据共享机制,以及重要专项数据的采购生产流程;我们有必要同心协力,上层出强支持,基层出动力,共同克服转型期的“不适”;我们有必要凝集内部的数据、技术和业务等目前较为分散的资源,融合力量,发展和引领网络安全+人工智能,奋力打造人工智能时代网络安全的国家品牌。

关键词:数据战略,人工智能,同心融合,网络安全



引言


       当前,人工智能已是习总书记讲话、政府工作报告和央视新闻中的热点词,2017年7月国务院更是针对性地印发《新一代人工智能发展规划》[1]。《规划》指出:“人工智能的迅速发展将深刻改变人类社会生活、改变世界。为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国”。发展人工智能已上升为国家战略。

       数据是人工智能时代的石油。人工智能(AI)是“使计算机去做过去只有人才能做的智能工作”的科学,借助现今强大的计算力和深度学习等技术的突破,它可以从大量数据中学习“智能能力”,不仅可以解放部分劳动力,而且在某些复杂的变量多的场景,它甚至可以超过人类,例如AlphaGo下围棋战胜世界围棋冠军柯洁。其实人工智能早起源于上世纪五十年代,经历过寒冬。正如以上所提,如今以深度学习为代表的人工智能正重新掀起热潮,离不开数据、算法和算力等三条件的同时满足。而且经过近几年的蓬勃发展,2018年人工智能被认为开始进入实干时代,即广泛落地应用的新阶段,此时实际应用场景的数据更被认为是重中之重。

       我国是“数据”强国。就如李开复所说[2]:现在,作为全球拥有最庞大数据的最大市场,中国开始使用AI为传统企业、互联网和各个领域创造价值。中国企业生态系统非常庞大,以至于当今在电脑视觉、语音识别和无人机方面最有价值的AI企业都是中国公司。与《规划》不谋而合,如何充分利用好我国的“数据”优势,在人工智能时代实现弯道超车,加快建设成为科技强国,至关重要。

       网络空间安全领域更是“数据”的高地,有海量的信息交互数据和日志数据,人工智能应用的潜在价值更巨大。网络空间安全领域的问题是繁多和复杂的,发展网络空间安全+人工智能是项艰巨的任务。与生物特征识别、语音识别等已常见的人工智能领域不同,网络空间安全的人工智能的生态相对封闭,高质量的数据和算法少有开源。各国均将之作为国家核心的机密项目倾力打造,以在将来的网络攻防和治理中夺取优势。

综上所述,作为网络安全国家队,可顺应时代需要、国家需要,提升数据战略,引领网络安全+人工智能潮流,打造人工智能时代网络安全的“国之重器”。


 提升数据战略


       一个传统的技术公司加上神经网络或者机器学习,这还不是AI公司。世界级人工智能专家吴恩达对人工智能时代AI公司的定义:1,数据搜集的战略;2,集中的数据库;3,普遍的自动化;4,人工智能技术人才。我们可以看到首要两项讲的均是数据战略,包括数据搜集和管理。因此,在公司顶层规划上提升数据战略是发展人工智能的必要前提。

一是深化数据思想

       深刻认识数据重要性,理解数据带动人工智能创新、数据驱动新业务的新发展模式。重视数据的搜集和管理,制定网络安全+人工智能发展战略和长远规划,更普遍地、更深远地、更有流程地去搜集和管理数据。在人工智能时代获得重要数据即是大收益。在考虑某些业务规划时,应将能获得的数据以及该数据的价值作科学的评估。例如,百度投入资源推出部分免费的AI云服务,提供给个人用户使用或者体验,其目的就是收集数据,用于提升其相应人工智能算法的精度。 

二是制定网络安全人工智能的数据战略

       无目的无差别地搜集数据或仅存储数据是不科学的,本身也是没价值的。公司顶层应研究网络安全人工智能的整体战略,研究人工智能对数据的需求,提出相应的数据搜集和管理战略,保证一定的可用性和价值。

三是重视相有业务过程产生的数据及其规范性

       数据很多时候是现成的。与安全领域的人工智能新创公司相比,这是我们作为国家安全企业的优势,我们已经有很多大业务,这些业务产生的数据是高价值的。但与新创公司相比,我们也有劣势。我们的人工智能人才占比较低,多数员工不懂数据的利用价值,容易忽视和错过数据,自然难做好数据搜集和管理。因此需要适当提高人工智能人才占比,与安全行业专家一道,为高价值的数据“保驾护航”。另外,强调业务过程产生的数据的规范性也是极其重要的,不规范的数据即使有价值,但可能也会因规整和清洗成本太高或者直接不可用而放弃。

四是考虑建立数据的集中管理和共享机制

       虑建立集中数据库,打破部门壁垒,实施真正意义上的统一管理。考虑建立数据共享使用流程,使各部门都可根据业务需要,使用集中数据库,训练相应的人工智能模型,最大发挥数据价值。

五是提供采购或生产数据的流程

       针对重要的新业务,当迫切需要全新的数据时,公司可考虑提供审批流程和专项经费,根据业务需要采购或采集标注特定场景下的数据,抢先训练相关人工智能算法,推出新智能业务,形成市场先发优势。并而后在用户场景持续积累数据,持续迭代提升对应的人工智能算法精度,逐渐形成以数据和产品迭代双重优势的强大壁垒。这也是目前人工智能领域独角兽企业和知名互联网公司常用的战术。


同心融合 共同打造网络安全人工智能品牌


       实施网络安全人工智能战略,需要同心协力,尤其是公司高层强有力的领导和支持。就如推行软件模块化一样,实施人工智能同样有不适应期。一是提升数据战略,发展人工智能是项长期战略,可能不会短期见效;二是初期上下对人工智能都有一个探索期,领导层尚未明确人工智能对网络安全的用处在哪,基层为数不多的人工智能小团队可能也是“拿锤子找钉子”;三是数据战略强调业务的数据搜集和规范性,不但短期内会带来一定的工作量和“不习惯”,而且不会产生直接效益,不影响现有项目的交互。这可能会引起基层的消极应对。此时需要公司考核的支撑。四是针对部分重要领域,数据还有必要投入不少资金去获得,例如商汤、百度、小米都以不同方式投入资源生产数据,或自建数据标注团队、或提供免费云服务、或采购数据。因此,发展网络安全人工智能,需要公司政策。上层有政策,基层有动力,重视、创造、应用数据。同心协力、与时俱进,打造发展新机遇。

       做强网络安全人工智能,内部需要融合,拧成一股绳,集中力量办大事。与以人工智能起家的新创公司不同,我们是大型国企,人工智能技术人才相对较低,行动起来也不那么灵活快速;与BAT、华为等公司相比,我们正处从科研事业单位向现代企业转变期,涉及业务和项目偏多偏小而杂,尚未完全摆脱“小作坊”模式。与网络安全人工智能发展相关的数据、人才以及业务需求等资源,在公司内部呈现出“小而散”的情况。例如,A部门有数据和业务需求但缺人工智能技术人才,而B部门有技术人才但在寻找业务和数据。因此,公司可考虑加强内部融合,例如搭建公司级人工智能创新平台,加强数据共享、技术合作,活跃创新氛围。

       铸造网络安全人工智能品牌,需引领行业潮流。当前人工智能热潮正风起云涌,网络安全领域更是如此。360、知道创宇、启明星辰等安全公司都在推出其基于人工智能的安全产品,例如创宇推出的暗链检测引擎基于人工智能自动分类识别算法,能够在第一时间发现最新的互联网暗链、黑链特征。从海量的日志数据发现未知威胁、从网络空间海量交互信息中识别有害信息、网络空间攻防等等,都是人工智能技术的大有所为之地,是当下的网络安全行业热点。作为网络安全国家队,提升数据战略,着力发展网络安全人工智能,我们有责任也有信心引领行业,打造网络安全新品牌。



【参考文献】

[1]国务院.新一代人工智能发展规划.[EB/OL].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.

[2]李开复.AI·未来[M].浙江:浙江人民出版社.2018年.




撰稿 | 朱家成       审阅 | 李慧、李姝     编辑 | 余多