国外创投新闻 | 神经搜索公司「Jina.ai」A轮融资3000万美元,拓展北美业务

据TechCrunch报道,总部位于柏林的Jina.ai今日宣布完成3000万美元的A轮融资,由Canaan Partners领投。Jina.ai是一家开源创业公司,该公司利用神经搜索帮助用户在非结构化数据(包括视频和图像)中查找信息。参与本轮融资的有Mango Capital和之前的投资方GGV Capital,SAP.iO和Yunqi Partners。迄今为止,该公司的融资总额已达到3900万美元。

图片截自企业官网

Jina.ai首席执行官兼联合创始人肖涵(与王楠、何冰共同创立了该公司)解释说,神经搜索背后的理念是使用深度学习神经网络超越传统的基于关键词的搜索工具。利用迁移学习和表达学习等相对较新的机器学习技术,该公司的核心Jina框架可以帮助开发人员快速构建针对特定用例的搜索工具。

肖涵解释说,对于图像、音频、视频或其他内容,他们首先使用深度神经网络将数据格式转换为通用表达。在这种情况下,它们主要是一个数学向量(一百维向量)。之后匹配算法不计算有多少字母匹配,而是计算数学距离,也就是这两个向量之间的向量距离。通过这种方式,人们基本上可以解决各种数据搜索问题或相关性问题。

肖涵认为Jina类似于搜索领域的TensorFlow(TensorFlow是谷歌的开源机器学习框架)。就像TensorFlow或PyTorch定义了人们如何设计AI系统的设计模式一样,Jina希望定义人们如何构建神经搜索系统,并成为在这个过程中这样做的事实标准。

但Jina只是Jina.ai的其中一个产品。该公司还提供了Jina Hub,该产品像市场一样,让开发者分享和发现以Jina为基础的的神经搜索应用的基本要素,以及最近推出的Finetuner,是一个可以微调任何深度神经网络的工具。

图片截自企业官网

肖涵表示,在过去的18个月里,他们花了很多精力来建立核心基础设施和这个大型神经搜索大楼的基础,目前这一部分已经完成了。现在他们正在慢慢地建造这座大楼的第一层和第二层,并且试图提供端对端的开发体验。

该公司表示,目前Jina AI开发者社区约有1000名用户,有电子游戏开发者使用它在多个游戏编辑器中右键自动填充相关游戏资产,也有法律技术初创企业利用该技术,使其聊天机器人能够利用PDF文档中的数据提供问答体验。

自2020年5月发布以来,开源Jina框架已经有近200名外部贡献者,该公司还围绕该项目建立了一个活跃的Slack社区。

肖涵表示,做开源的主要原因是速度,他们相信开发的速度是一个软件项目成功的关键因素。很多软件因为速度趋近于零而消亡。他们正在创建社区,并利用社区收集反馈以快速迭代,这对于像他们这样的基础设施软件来说非常重要。他们需要所有顶级开发者给出关于可用性、易访问性等方面的反馈,这可以帮助他们迅速改进。

Jina.ai计划利用新一轮融资将其团队扩大一倍,特别是要拓展其在北美的业务。有了这个扩大的团队,公司计划投资研发,以扩大整个Jina生态系统,并围绕它推出新的工具和服务。

Canaan Partners的Joydeep Bhattacharyya表示,传统的文本数据搜索系统无法在这个充斥着图像、视频和其他多媒体的世界中工作。Jina AI正在将公司从黑白模式转变为彩色模式,以一种快速、可变和数据不可知的方式解锁非结构化数据。神经搜索为改进决策、优化运营甚至创造新的收入来源提供了基础,这些开源框架的早期应用已经展现出了未来的曙光。