数牍科技成立于2019年初,在国内较早以系统性隐私工程视角和基于协作场景的产品来落地隐私计算,并与合作伙伴共同推进隐私计算的多个首次突破。成立的两年时间内,数牍与三大运营商、银联、工商银行、北京银行等多家国央企、金融机构、头部互联网公司及其对应各行业的数据协作生态企业达成合作,覆盖金融、营销、风控、医疗等场景,积累了近百个数据协作产品和模型。2020年,数牍科技在行业内率先落地运营商场景,成为联通隐私计算平台技术合作方,与联通共同完成行业首个TB级隐私计算商用项目落地,目前仍在持续同联通联合研发,力争在亿万级数据量生产环境中的技术突破。2021年,数牍参与了深圳数据交易所关键技术预研,与深圳数据交易所共同探索数据要素市场建设,并提供数据流通环节中的隐私计算技术平台支撑。同时,数牍还成为上海数据交易所首批签约数商,北京国际大数据交易所联盟首批成员单位。
数牍科技积极参与公安部、工信部、国家金融科技测评中心等国家部委和权威机构的多项认证,成为行业首批通过信通院金融场景隐私保护计算平台测评的公司,并积极参与推动隐私计算技术的行业标准设定和技术落地——与中国信息通信研究院、中国电子技术标准化研究院、北京大数据中心、中国电子工业标准化技术协会信息技术应用创新工作委员会等多家机构合作并编写行业白皮书。
数牍科技创始人宋一民毕业后在Juniper担任安全工程师;之后加入微软Azure,成为存储和计算早期团队成员,参与了Azure Cloud从零到一的搭建过程;在微软积累了五年多云计算经验后,宋一民加入Facebookads,主导了Facebook收购instagram后的数据打通等大型数据工程项目,并在内部发起Facebook和多个世界五百强公司基于多方安全计算的数据协作项目。云计算、数据工程和隐私、安全十多年的经历,让其对隐私计算深厚的技术栈有更深刻的理解和全局视野。联合创始人蔡超超博士毕业于UCLA,是机器学习和联邦学习领域专家,曾获得FacebookDistinguished Equity(杰出贡献奖)。
数牍的工程团队覆盖密码学、联邦学习、分布式计算、云原生、数据科学和数据工程、安全等领域,来自华为、字节跳动、Facebook、Google、Amazon、Microsoft等国内外顶尖的科技企业。有Google Cloud BigQuery的大数据系统架构师,有曾在Facebook 隐私基础构架组(Privacy Infrastructure)从零到一参与隐私工程系统性搭建的数学和密码学科班工程师,有Compass等云原生前沿企业的基础架构负责人,有华为硬件安全资深专家等,并有多名ACM获奖者。产品和销售团队由来自金融、营销、风控、医疗等行业头部企业的一线专家组成,行业积累和场景理解深厚。从最初的宋一民、蔡超超两个人到目前的一百多人团队,“我们有二十多个工程师都是放弃硅谷高薪带着家人回到祖国,我们希望将隐私工程技术栈各个关键模块的人才引回祖国,并与国内的技术和行业专家共同打造国产自主研发的、具有核心知识产权的隐私工程平台”。
相较于作为协作关键环节的“隐私计算”,“隐私工程”更能表达数牍团队对数据流通全生命周期的愿景与理解。隐私工程是一套从底层计算及网络资源到最上层数据产品及应用的工程体系、贯穿对数据流通全生命周期的理解,要在严格的隐私保护和数据安全基础上,做好系统效率、网络成本、用户体验的平衡;也需要细节详尽的工程技巧,包括敏感数据检测、匿名技术、数据追踪等技术运用,甚至要具体到诸如用户标签分类在隐私保护和准确度间的权衡问题。
隐私工程的思想也体现在数牍科技全自主研发的隐私计算平台Tusita上:
1)在“计算分布式,流通可监管”的架构设计中,原始数据及模型在本地进行分布式处理,监控节点能实现开放透明的流通可视;
2)将性能优化做到极致,实现工业级部署和落地。目前Tusita在十亿级数据量协作场景和高并发、高实时性环境中,能够进行毫秒级响应,满足多种复杂场景的业务需求;
3) 开箱即用的产品体验和可插拔的兼容性。可视化、针对不同的应用场景丰富的产品和模型支持,让用户上手即用、将使用门槛降到最低。同时平台充分考虑了各类数据基础设施和治理产品工具的对接,降低不同类型数据的接入成本;
4)贯穿数据全生命周期的工具链支持。从数据安全和隐私治理到下游协作计算,数牍研发了多个易用且解决痛点的工具、贯穿数据流通全链路,未来也会进一步开放给生态用户。
隐私工程扎实落地场景的同时,数牍前沿研究团队也实现了计算机体系架构层面的硬件突破。不同于现有的TEE或硬件加速方案,这是一套通信和体系架构层面的创新,在大幅度提高计算性能的同时,能进一步解决数据投毒、计算不可信等问题。
数牍从成立初期就开始搭建行业专家组成的产品与场景团队,探索数据协作场景并进一步抽象为数据产品和模型。在宋一民看来,通过基于协作场景的数据产品或模型才能让隐私计算真的被用起来发挥作用,但不是把传统的数据产品用隐私计算技术重新做一遍,其更大场景在于增量协作场景的价值创造。数牍产品和场景团队两年间探索了数百个协作场景,抽象了数十个通用产品和近百个模型,包括风控反洗钱、销售线索去重和线索评级等产品,已落地多家头部车企、头部金融机构、互联网公司和新经济企业。其中不少产品还是行业基建类型的首创。
比如由数牍参与研发和运营,中国信通院、电信运营商和中国商务广告协会共同推出的数字营销行业基建产品“ONEID”。ONEID是依托中国信通院的数据安全体系、基于运营商认证能力生成的匿名广告标识,可以在充分保障隐私信息匿名化、不可逆推的属性基础上,识别不同平台和媒体的设备真实性,赋能广告业务。
两年来,数牍与三大运营商、中国银联、中国工商银行、北京银行等行业头部企业都展开了深度合作,协作其与上千家生态企业通过隐私计算进行数据协作。数牍的第一步是通过安全高性的隐私计算基础设施和可落地的数据协作产品,帮助头部企业及其数据生态建立连接和协作,并打磨隐私计算平台Tusita的易用性、稳定性和工具链生态。