对於寻求竞争优势的企业来说,机器学习(Machine Learning)是一项不可或缺的技术,它可以快速处理大量数据,帮助企业更有效地向顾客提出建议,优化制造流程或是预测市场变化;而在商业情境中,机器学习即服务(Machine Learning as a Service,MLaaS)提供商则被定义为━━设计和导入机器学习模型的公司,借助机器学习技术为客户提供持续一贯的服务。
专精於人工智慧(AI)的台湾新创公司沛星互动科技(Appier)发表对机器学习即服务在实务应用上的挑战与机会的观点。如今,企业每天都要处理大量的数据,数据成长的速度比以往任何时候都要快;同时,由於产业竞争的迅速变化,能否快速进行决策对於商业组织来说至关重要,因为业务的成功取决於能否善用现有的资讯做出快速、准确的决策。这对於顾客需求与行为快速变化的产业格外重要,特别是2020年以来COVID-19大流行,人们的购物习惯、工作行为和社交方式都发生急遽的变化,也迫使企业也不得不改变服务客户的方式以满足新的需求。这意味着企业搜集和处理数据所采用的技术必须更加弹性,才能更快地导入新数据,并且灵活地在商业决策上应用,赋予企业快速采取行动的竞争力。
Appier观察将「机器学习模型」延伸为「机器学习即服务」的当前挑战在於━━如何建构模型?以及如何教会未来的机器学习人才落实这项工作?目前机器学习模型的研发工作多半集中在单一模型的建构上,通常人们采用一组数据用於模型的训练上(预先设定好系统该具备哪些功能与标签)以针对另一组数据的标签(通常称为测试数据)产出精准的预测。但是,如果希??满足的是现实世界中顾客不断变化的需求,企业用以训练和测试模型的数据就不能那麽清楚地一分为二;因为,今天用於测试或预测的数据可能立刻就要作为明天用於训练模型的数据,才能让模型不断优化,拥有更隹的表现。
基於Appier多年的实务经验,用於训练模型的数据也不可能完美,原因除了现实世界中的数据来源不完整、数据并非结构化数据(例如客户的开放式问卷),数据在搜集过程中也有可能存在偏见(例如,用以训练推荐模型的数据通常是来自另一个线上推荐系统搜集到的反??)。正因为训练模型的数据存有另一个模型的影子,偏见不可能消失。
而人们最在意的结果通常是最难被预测和推论的,以电商品牌的数位行销过程为例,常见的用户旅程是消费者「点击商品」、「查看商品」、「将商品加入购物车」、最後才「购买商品」;但往往系统所记录的用户轨迹很少这麽单纯,人们可能会在不同设备上多次查看某件商品,可能会将商品从购物车移除後再重新加入,可能在犹豫了好一阵子後还是放弃购买,这些复杂的动机与行动都是单一机制难以去预测和推论的。
而且,要得知用户到底有没有购买会比取得其点击或浏览的数据更加困难(如果消费者不是在你的平台完成结帐,商家根本无从得知他是否还想要收到这件商品的广告)。假如MLaaS只仰赖最简单点击和浏览指标,模型的建议很有可能无法满足最终的业务目标,因为模型有可能在错的时机发送推播讯息。
一家提供机器学习服务的B2B AI公司可能同时要为成千上万个来自不同领域的客户提供服务,为了使数千个模型能够始终如一地运行,持续在线上提供服务,并且满足客户不断变化的业务目标,需要每天不断对模型进行训练或更新数据,好让模型因应现实世界中客户不断变化的任务需求做出调整;因此,模型创建者不仅要完善模型自动训练的流程,还需要确保模型发生局部误差的概率趋近於零,才能持续满足客户提出的业务目标。
当机器学习模型产出的结果出??预期时,有时不是源於机器学习的模型预测错误,而是作业链中出现问题。举例而言,推荐引擎需与线上网页建立连结以向顾客展示商品;而当连结中断或是有延迟的时候,客户的点击率就会被影响。这样的结果并不是模型推荐错误造成的,而且往往要花上一段时间才能找出错误。如何能够快速的找出可能的问题所在,是采用MLaaS的公司需要具备的能力。
维持MLaaS模型整体的稳定性和机动性是一件非常具有挑战性的任务,需要仰赖持续不断的投资、研究和实验落实,能做到这一点的公司将享有MLaaS带来的巨大回报,因为随着时间持续迭代的模型能帮助他们适应不断变化的商业环境,在业界保持领先地位。