财务狗的短期未来？大数据、人工智能篇

隋秉华

1人赞赏了该文章 326次浏览编辑于2018年05月03日 22:38:06

人工智能？机器学习？深度学习？神经网络？大数据？商业智能？区块链？财务机器人？......

这几年这些概念似乎都说被烂了，可是讲真，即便是 2018 年的现在，还是有种 “只见打雷不见下雨” 的感觉。这些前沿科技的出现真有说的那么厉害？真能取代我这么个活泼可爱的财务狗金融狗么？（手动卖个萌）去年的我确实有点草木皆兵了，生怕自己会落后一步，现在经过转型和尝试之后觉得，其实短时间内（三五年？）我们还有足够的时间去准备，短时间内这些技术对财务金融领域的影响一定不会是颠覆性的，为什么呢？因为大多数企业现在都还在漫长的准备阶段，像竹子生长一样，前 4 年总共也只不过长 3cm，但是从第 5 年开始，它就以每天 30cm 的速度疯狂生长着，这样只用 6 周就可以长到 15 米。但现在处于前 4 年，实际企业数字化转型远不止需要 4 年，所以表面上看起来，大家似乎都一样，风平浪静，掀不起啥大波澜，可准备阶段完成后，恐怕就挺残酷了，我希望在这个时间点再记录下我对这些概念的理解和自以为的未来可能性，留着以后崇拜自己或者笑话自己，哈哈。

提前预警：本文内容一点也不深，只是结合个人经验的一些思考罢了，真の大神轻喷，感谢~ 先丢一个目录出来（前面会说太多的基础概念，不想看的直接跳到 Part 3 吧）

Part 1：大数据

Part 2：人工智能-机器学习-深度学习-神经网络

Part 3：大数据&人工智能在财务金融领域的应用（以财务机器人为例）

Part 4：区块链

Part 1：大数据

大数据，怎么个大法儿呢？不废话，就是全量数据代替样本数据，因为随着科技的发展我们现在已经不再受限于海量数据难以存储、全量数据难以运算的瓶颈，那全量全在哪里呢？大概可以用这 4个V (Volume、Variety、Value、Velocity) 来概括：

Volume-数据量大：就字面理解意思就行，毕竟现在农村也都通网了嘛，全世界的老铁们都无时不刻在产生着各种交易数据、行为数据、内容数据......（稍微皮一下）

Variety-数据种类多：在过去，所有的类型的数据（传统企业数据、机器和传感器数据、社交数据）大多都是以便于存储的以文本形式为主，结构化为主，而随着现在互联网、移动互联网的繁荣，流媒体也越来越丰富，数据结构可能既不规则也不完整，不方便用数据库二维逻辑表来表现的非结构化数据就越来越多，例如所有格式的办公文档、各类报表、XML、HTML、网络日志、音频、视频、图片、地理位置信息等，而这些多类型的数据对数据的处理能力提出了更高要求。

Value-价值密度低：首先要清楚的概念是：[数据] 本身不代表 [知识]，[大数据] 不代表 [大知识]，数据到知识再到价值的转化是需要层层挖掘的，而如何通过强大的机器算法更迅速地完成数据的价值提纯就成为了目前大数据背景下最亟待解决的难题。

Velocity-处理速度快：同样字面理解就行，天下武功唯快不破，哪家企业能更快搞定上面的三个问题，哪家就更牛逼。

多插一句，下面内容较多出现 [非结构化数据] 和 [结构化数据] 这两个名词，为了方便大家理解，大家就把 [非结构化数据] 理解成 Word， [结构化数据] 理解成 Excel 吧，[非结构化数据] 转 [结构化数据] 就是让你从 Word 文档中提取出关键信息形成 Excel 表格，方便数据库存储，这样理解虽然不太准确，但是够直观，够简单粗暴。

好了，大致就说这么点儿基础概念吧，更专业的 Hadoop Spark Hive 啥的我也不说，我也不懂。如果还有想继续深入了解的可以看下这篇文章，我上面的内容也提取自这儿：

大数据最核心的价值是什么？www.zhihu.com

接下来先说下大数据和人工智能的关系吧，这个很重要：如果说一个公司一个产品是一艘船，那数据就是船上所承载的货物，这是最核心的东西，是一个企业赖以生存的最重要的资产，人工智能机器学习的核心算法就是这艘船的动力引擎。

作为 “货物”，肯定是种类越多越好，数量越大越好，价值越高越好，最好流转速度也快。货物要流转，就需要物流系统，智慧物流系统，要不然你网上买个东西怎么可能隔天就送到你手里，物流界的 “最后一公里” 难题，换到企业也同样，数据传递的 “最后一公里” 也一直没有得到规范化，系统化。

作为 “引擎”，蒸汽机一定也比不上内燃机，驱动数据的引擎也同样，普通的 ERP 自然比不上人工智能。

可理想很丰满，现实......满足大数据所需要的 4V 标准的企业并不多，尤其是数据结构化方面，我觉得大多数企业做的还远远不够，企业内部太多太多的数据还处于 “脏乱差” 的状态，人去处理提取出价值都特别费劲，就更别提让机器自己学习了，人工智能这个引擎工作的前提是货物足够多足够整齐规范。货物少而且乱，换再牛逼的引擎也只能捣捣糨糊，总之，任重而道远。

Part 2：人工智能-机器学习-深度学习-神经网络

同样，先不废话，先直接上一张图，简单来理解的话就是：

机器学习是实现人工智能的方法之一，

深度学习是实现机器学习的方法之一，

大多数情况下深度学习指的就是多层神经网络。

我知道这么说不准确，但行外人士大致这么理解差不多也足够了，准确的图大概应该是这样的，有兴趣的可以自己去深入去了解~

人工智能

先来说最宏大的人工智能，就拿大家上网的时候不可避免要填的验证码来举例子吧，嗯，你是不是觉得很简单啊？可是这对于电脑来说简直难爆了。

的确一些我们觉得困难的事情——微积分、金融市场策略、翻译，对于电脑来说都太简单了，

我们觉得容易的事情——视觉、动态、移动、直觉，对电脑来说太 TM 的难了。

好比说当你举手拿一件东西的时候，你肩膀、手肘、手腕里的肌肉、肌腱和骨头，瞬间就进行了一组复杂的物理运作，这一切还配合着你的眼睛的运作，使得你的手能都在三维空间中进行直线运作。对你来说这一切轻而易举，因为在你脑中负责处理这些的 “软件” 已经很完美了。可你要知道机器人可是近几年才能做到直立行走遇到障碍也不跌倒的，这个可是在我们人类从猿猴进化过来的那一刻就彻底学会了。同样的，当你看到一个东西的时候，感觉到一个东西的时候，你的大脑都是秒处理的，这些对我们来说很简单的事情，其实是很复杂的，因为它们已经在动物进化的过程中经历了几亿年的优化了。

用计算机科学家 Donald Knuth 的说法，“人工智能已经在几乎所有需要思考的领域超过了人类，但是在那些人类和其它动物不需要思考就能完成的事情上，还差得很远”。

总之，人类的大脑是我们所知宇宙中最复杂的东西，看看 Siri 这些 “人工智障” 就能感受到，不是机器不努力，是人脑太牛逼。

上述内容引自

@谢熊猫君

大神的文章，附上原文链接，写的超级好，墙裂推荐大家有空详细了解下。

谢熊猫君：为什么最近有很多名人，比如比尔盖茨，马斯克、霍金等，让人们警惕人工智能？zhuanlan.zhihu.com

机器学习

大概说了下人工智能是什么，那人工智能怎么实现呢？——机器学习，顾名思义，就是让机器像人一样去学习，那怎么学习呢？人可是很聪明的，你告诉一个小孩那是一只站着的猫，小孩就可以认得躺着的猫，趴着的猫，跑着的猫......是的，人可以举一反三，可机器不行，你得提前告诉机器各种状态的猫，你下回问它的时候才能认得这只动物是猫，机器是举三反一，甚至举三都不一定反的出来一，机器需要大量的有效数据去喂它，训练它，所以才需要上面所说的大数据。

虽然机器学习是在阿尔法狗之后才大火了一把吧，但这东西其实早就渗透在我们的生活中了，语音识别，图片识别，翻译软件，垃圾邮件短信过滤，淘宝京东买东西的兴趣推荐，头条新闻的推荐，这些全都是机器学习。

那么这东西究竟本质是什么呢，就是让机器在没有被 [完全编程] 的情况下，具备学习的能力，传统的编程都是要穷尽每一种可能性的，例如出去买个苹果啥的，然后跟售货员砍价，所有的可能性你都要列出来写到程序里，让程序判断每一步的 Yes or No 对应的不同的结果，附上一张图和原文链接大家感受下：

大误 · 你们编程的买苹果好复杂哦daily.zhihu.com

可是如果遇到极其复杂的东西，好比说人的兴趣是不可能穷举的，并且兴趣这种东西可能天天变，所以就必须搭框架，告诉它一个基本的规则，后面就让机器自己去学习，让机器像人一样去总结规律，先让它自己去猜这是个什么东西，自己去总结规律，提取出一些关键信息，好比说还是看到一只猫，让机器自己总结猫有什么特征，尖尖的耳朵？还是圆圆的头？还是别的什么特征？还有没有什么例外情况？然后人再告诉他正确答案，像教小孩儿一样去教机器自己学习，看得多了学得多了不就会了嘛？可是问题来了，怎么才能让计算机像人一样去发现隐藏的特征呢？那么我们就先得知道人是怎么看东西的，怎么提取特征的。

神经网络

层层深入说到这里，我先坦白，上面只涉及到概念的内容，我作为外行人士还能看看别人的文章自己消化消化，转述转述装装逼，其实上面的机器学习还分监督学习和非监督学习，我已经恬不知耻地略过去了，更加深入的机器学习的实现方法——深度学习（多层神经网络），就更是在讲上面内容的具体技术实现了，没有技术底子的我恐怕也真说不清各位也看不懂了。什么？不信看不懂？

怎么样？还要继续看嘛？我还是丢上个链接给有兴趣深入了解的童鞋吧，我是编不下去了。

神经网络浅讲：从神经元到深度学习 - 计算机的潜意识 - 博客园www.cnblogs.com

最后，其实这些概念这么火都不是最近才有的，上世纪 60 年代那会儿就有了，只不过受制于当时计算机的处理性能很难设计出深层的神经网络结构，层级一多电脑就挂了，而且也没有大数据支持，没有那么多样本去支撑机器学习，所以都一直没得到重视，资本看不到商业前景也不愿意投钱进来，发展也一直磕磕碰碰，没有见到足够震撼的科学技术的进步。而现在我们大概有足够的技术去慢慢挑战人类所能想象的科技界最突破性的发明（AI）了，我还是蛮期待未来的，期待超人工智能出现后的吸引态究竟会是灭亡还是永生，哈哈扯远了，说回正题。

Part 3：大数据&人工智能在财务金融领域的应用（以财务机器人为例）

相继去年德勤财务机器人刷爆朋友圈之后，前阵子我老东家天职也推出了自己的财务机器人，想必其他事务所也都有所行动，原谅我没有感受到那么大动静就不提了，附上两个链接

德勤财务机器人正式上岗，工作视频首次曝光！效率相当惊人，财务人看完都慌了···mp.weixin.qq.com 【天职财务机器人上线】财务工作还可以这样做……mp.weixin.qq.com

首先，大家都知道财务的很重要一个职能就是记账，记录就需要原始凭证来证明这件事儿的真实性准确性。那么凭证这种纸质文件，是一家企业的 Output，而很多时候，不管是部门内部，还是外部审计，都是依赖你的 Output 作为他们工作的 Input 的，例如大家可以想想企业内部的 AR AP 审付款单、报销单、审预算单、审计狗抽凭、函证......投入了多少人力在里面。先不说纯粹的 “无纸化” 什么时候可以实现，即使有纸，在当下和短期的未来来说，理应也可以通过图像识别技术自动把这些纸质文件和图像这些非结构化数据直接转化成结构化数据，一来可以方便他人，二来可以形成企业自身真正意义的 “大数据”。

可能不太恰当，我把财务工作划分为四个属性：信息记录、流转、分析、决策。那财务机器人能解决什么问题？简单说就是记录和流转以及少量分析，上面也说到了，财务工作中有太多高度重复且又必要的一些信息录入的操作了，手工操作出错率高先不说，录入之后的数据结构通常又得不到控制，源头上的数据可能就不够规范，在跨部门的信息流转中可能就更加不规范，进而导致跨岗位或跨部门协同作业或者数据核对沟通成本高，效率低。所以财务机器人才应运而生。

财务行业自从诞生之日起就不断进行着以下渐进式的创新：

手工记账——计算机简单记账——ERP系统记账——财务共享中心------财务机器人

其实企业的财务共享中心或者事务所的全球交付中心（Global Delivery Center）的思路已经把数据录入和整理核对这种重复性高的工作给流程化，系统化了，只保留相对高级的职能在企业内部。这也正是财务共享中心和全球交付中心的职位薪资待遇都相对低一些的原因。

而财务机器人也只是渐进式创新中的一环、上述四个历史进程上的下一进程，并不会带来巨大的颠覆性效果，它其实就是把当下最前沿的 AI 技术（图像识别、语音识别等）应用在传感器等硬件上实现数据录入和流通的进一步规范化，实现对财务中心的进一步浓缩或者取代，为机器学习所需要的真正的 “大数据” 做准备。

我所能预见的短期未来会是这样的：财务狗拿到了一沓合同文件、发票、各种报销单据或者其他文件票据，打开一台智能扫描仪，扫描仪迅速扫描完成后，传递到后台的图片和文字识别系统（OCR、 PaddlePaddle 深度学习框架等），印刷字体形成的图片转换文字识别成功率现在应该还比较可观，手写字体的话大概也就只需要用在签名的地方了吧，用电子签章也可以办得到。或者索性不用扫描文件本身，未来的纸质文件内容同时也存放在随文件附带的二维码甚至更尖端一点的 RFID 码上，扫码即可自动精准提取出合同、发票等文件的关键信息，例如合同号、发票号、产品名称、甲方乙方、时间、数量、单价、金额、电子签章......然后把这些信息自动传入指定 ERP 系统的指定数据库中的结构化的数据表，然后直接自动生成会计凭证结转分录、自动分类预算科目、自动匹配销售订单、应收应付单据截止日自动提醒、甚至自动收付款、自动完成固定资产无形资产的折旧与摊销处理、月末年末自动配平三张财务报表......从此信息的录入、整合与流通高度系统化，结构化，规范化，对此人只需要修改系统逻辑与异常处理，以及 [记录] 之后的 [分析] 与 [决策] 这种非流程性、不可预见的工作。

其实，现在 [分析] 的职能也正在被机器所侵蚀了，一些简单的求和、平均、同比环比预实对比分析、差异分析或者其他简单的描述性统计分析，只要数据输入阶段是规范的，产出简单的分析结果就是张张嘴说句话的事儿，从数据输入到结果产出中间的所有自然语言处理（NLP）、数据计算、分析都可以系统化、傻瓜化。具体怎么玩儿大家可以看下这篇文章

JackRacer：从商务智能到人工智能还有多远，BI+AI =？zhuanlan.zhihu.com

等稍微长期一点的未来，机器自己在海量结构化的数据中学会了学习形成了经验，像阿尔法狗一样，像正在被攻克的暴雪游戏《星际争霸》一样，如果非完全信息博弈的游戏都被攻克了，机器有更强大的能力自己做 [决策] 了，那么其他领域，想必很多管理层的座位都会不稳吧。

说完愿景，那财务机器人又有哪些潜在的风险和推动难度呢？第一点：政策环境、市场环境瞬息万变，政策可能就一句话的事儿，落实到企业经营层面可能就是彻头彻尾的逻辑重构或巨大调整，新兴行业尤其如此，而系统逻辑的设置，短期的未来，这种业务逻辑的搭建和系统设置无疑都需要扎实的财务知识，这是机器人所无法替代的，也是很难完成自我学习的部分。第二点：高度集成化的系统某种程度上又降低了造假的难度，之前要串通好几个部门的人才能实现造假，现在可能只需要改改系统逻辑就好了，如果没有完善的核查机制和内控流程，这个机器人就很可能成为某些利益群体粉饰报表的工具。

上述内容部分整理自

@蔡千年

的新书《财务思维:如何成为一个财务高手》，有兴趣的童鞋也可以自己去京东上找下看看。

好了，就先说这么多吧，其实不仅仅是财务领域是这样，其他领域也都类似，只要前期数据准备的规范化了，数据记录，流转和简单的分析机器都完全办得到的，但是如果不规范，本来就输入了一堆垃圾信息，就别指望机器能有啥作为了。开发是如此，前期需求整理和可行性分析阶段做的足够充分，真正开发起来其实是很轻松愉快高效的；审计也是如此，只要内控系统足够完善，流程足够规范，实质性程序是可以做很少的。可现状是，开发加班加成狗，审计加班加成狗，很明显，我们的大多数精力的确可能是后置了，没有前置到准备阶段，至于现状为什么是这样，我不是管理层，我也不太了解，可能是因为企业发展初期迫于生存的需要不会考虑很多结构化，规范化的事情吧，毕竟那么弄会影响到效率，会有个投入产出比的问题，这可能也是现代管理学的一大难题，我解释不了。

最后，希望这篇文章对大家能有所启发，也希望大家在真正的人工智能到来之前可以像竹子一样，先稳稳的扎根，去主动学一些东西迎接随时可能到来的巨变。

噢，还有 Part 4 区块链，放在下篇再说吧，不过千赞不更，哈哈，傲娇脸

本文来源：

知乎

https://zhuanlan.zhihu.com/p/35187074

1人点赞

还没有人点赞，快来当第一个点赞的人吧！

打赏

0人打赏

还没有人打赏，快来当第一个打赏的人吧！

赞 1 评论收藏

财务狗的短期未来？大数据、人工智能篇

恭喜您！