在其他语言中绑定 TensorFlow

背景

本文旨在说明如何在其他编程语言中创建或开发具有 TensorFlow 功能的程序提供指导。它描述了 TensorFlow 的特性及使得它们在其它编程语言中实现相同功能的推荐步骤。

Python 是 TensorFlow 支持的第一种且支持特性最多的客户端语言。随着越来越多的功能被移植到 TensorFlow 内核（在 C++ 中实现）并通过 C API 公开。客户端语言应该使用语言的外部函数接口（FFI）调用 C API 以提供 TensorFlow 功能。

概述

在一个编程语言中提供 TensorFlow 的功能可以分解为下面几个广泛的类别：

运行一个预定义 Graph：给定一个 GraphDef（或 MetaGraphDef）协议消息，能够创建一个会话，执行查询并获得张量结果。这对于想要在预先训练的模型上运行推断的移动应用或服务器来说足够了。
Graph 构造：每个定义的 TensorFlow 操作至少有一个函数将操作添加到图中。理想情况下，这些函数会自动生成，以便在操作定义被修改时保持同步。
梯度（即自动微分）：给定一个图和一系列输入输出操作，将操作添加到图中，计算输出与输入的损失函数的偏微分；并允许能够对图中特定的操作自定义梯度函数。
函数：定义一个可以在 GraphDef 的多个位置调用的子图，并定义一个 GraphDef 内的 FunctionDefLibrary 中的 FunctionDef 。
控制流：构造用户特定子图的"If"和"While"操作。理想状态下，这些控制流能与梯度共同工作（见上）。
神经网络库：许多组件支持创建神经网络模型并对其进行训练（可能在分布式环境中）。虽然用其他语言提供这种服务会非常方便，但目前还没有计划支持 Python 以外的语言。这些库通常是对以上功能的封装。

至少，一个语言的绑定必须支持运行预定义的图，当然这也意味着需要支持图的构造。 TensorFlow Python API 提供了所有这些功能。

当前状态

新的语言支持应该建立在 C API 之上。但是，正如下表所示，并不是所有的功能都可以在 C 中使用。在 C API 中提供更多的功能是一个正在进行的项目。

特性	Python	C
运行预定义 Graph	`tf.import_graph_def`, `tf.Session`	`TF_GraphImportGraphDef`, `TF_NewSession`
生成操作函数的图构造函数	支持	支持 (C API 提供客户端语言支持)
自动微分	`tf.gradients`
函数	`tf.python.framework.function.Defun`
控制流	`tf.cond`, `tf.while_loop`
神经网络库	`tf.train`, `tf.nn`, `tf.contrib.layers`, `tf.contrib.slim`

推荐方法

运行预定义 `Graph`

一个语言的绑定应该定义下面的这些类：

Graph：表示 TensorFlow 计算图。由操作组成（在客户端语言中由Operation表示）并用于 C API 中的 TF_Graph 。主要用于创建新 Operation 对象和启动 Session 时的参数。并同时支持通过运算符的图的遍历（TF_GraphNextOperation）、按名称查找操作（TF_GraphOperationByName）以及从 GraphDef 协议消息（C API 中的TF_GraphToGraphDef 和 TF_GraphImportGraphDef）进行转换。
Operation：表示图中的计算节点，对应于 C API 中的 TF_Operation。
Output：表示图中操作的某个输出，包含一个 DataType（和张量最终的形状）。可作为输入参数传递给一个函数，用于向图中添加操作，或传递给一个 Session 的 Run() 方法来获取输出张量。对应于 C API 中的 TF_Output。
Session：表示客户端到 TensorFlow 运行时的特定实例。它的主要工作为使用 Graph 及一些选项，然后调用图的 Run() 方法。对应于 C API 中的 TF_Session。
Tensor：表示具有所有相同 DataType 的元素的 N 维（矩形）数组。获取数据输入输出 Session 的 Run() 调用。对应于 C API 中的 TF_Tensor。
DataType：TensorFlow 支持的所有可能的张量类型的枚举。对应于 C API 中的TF_DataType，在 Python API 中通常称为 dtype。

Graph 的构造

TensorFlow 具有许多不同的操作，并且不会永远不变。因此我们建议生成用于将操作添加到图中的函数，而不是逐个手动编写（尽管找到生成器写法的最好方法是手写几个函数）。生成函数所需的信息包含在 OpDef 协议消息中。

有几种方法可以获得已注册操作的 OpDef 列表：

在 C API 中的 TF_GetAllOpList 会检索所有注册的 OpDef 协议消息。这可以用来为客户端语言编写生成器。这便要求客户端语言具有协议缓冲区支持以便解释 OpDef 消息。
C++ 函数 OpRegistry::Global() -> GetRegisteredOps() 返回所有已注册的 OpDef（在[tensorflow/core/framework/ op.h] 中定义）的相同列表。这可以用来在 C++ 中编写生成器（对没有协议缓冲区支持的语言非常有用）。
该列表的 ASCII 序列化版本通过自动化过程定期检入[ tensorflow/core/ops/ops.pbtxt]。

OpDef 包含以下内容：

驼峰法命名的操作名称。对于生成的函数，遵循该语言的约定。例如，如果语言使用 snake_case，则应使用这种习惯而不是 CamelCase 作为操作的函数名称。
添加一个新操作（Op）
属性列表及其默认值（如果有的话）。需要注意的是某些默认参数的类型（从输入中）推导情况、可选参数（如果有默认值）以及实参（没有默认值）。
操作文档以及输入、输出和非推断属性。
运行时使用的一些其他字段，可由代码生成器忽略。

OpDef 可以转换成一个函数的文本，使用 TF_OperationDescription C API（包含在语言的 FFI 中）将该操作添加到图中：

从 TF_NewOperation() 开始创建 TF_OperationDescription*。
每次输入调用 TF_AddInput() 或 TF_AddInputList() 一次（取决于输入是否具有列表类型）。
调用 TF_SetAttr *() 函数来设置非推断属性。如果不想覆盖默认值，则可以跳过默认值的属性设置。
在必要时设置可选字段：
- TF_SetDevice()：将操作强制设定到一个特殊设备上。
- TF_AddControlInput()：在此操作开始运行之前添加其他操作完成的要求
- TF_SetAttrString("_ kernel") 用来设置内核标签（很少使用）
- TF_ColocateWith() 将一个操作与另一个操作合并
完成后调用 TF_FinishOperation()。这会将操作添加到图中，以后无法对其修改。

现有示例将运行代码生成器作为构建过程的一部分（使用 Bazel genrule）。或者，代码生成器可由自动化 cron 进程运行，可能会检查结果。这会在生成的代码和存储库中的 OpDef 之间产生分叉的风险，但对于那些需要提前生成代码的语言来说是有用的，如 Go 中的 go get 和 Rust 中的 cargo ops。另一方面，对于某些语言来说，代码可以从 tensorflow/core/ops/ops.pbtxt 动态生成。

处理常量

如果用户可以为输入参数提供常量，那么调用代码将更加简洁。生成的代码应该将这些常量转换并添加到图的操作中，并用作实例化的操作的输入。

可选参数

如果语言支持一个函数拥有可选参数（比如 Python 中带有默认值的关键字参数），则可以将它们作为可选属性、操作名、设备、控制输入等。在某些语言中，可以使用动态作用域（类似于 Python 中的「with」块）来设置这些可选参数。如果没有这些功能，则可以尝试使用「生成器模式」，类似于 TensorFlow API 的 C++ 版本的做法。

作用域命名

使用 Scope 层次结构一类的方法来支持图操作作用域命名是个不错的选择，尤其是考虑到 TensorBoard 依赖它以合理的方式显示大图。现有的 Python 和 C++ API 使用了不同的方法：在 Python 中，名称的「目录」部分（直到最后一个「/」）都来自 with 代码区块。事实上，这里有一个局部的线程堆栈，在这个作用域下定义了命名的层次结构。在 Python 中，名称的最后一个组件由用户显示提供（使用可选的 name 关键字参数）或者默认为需要添加的操作类型的名称。在 C++ 中，名称的「目录」部分存储在显式的 Scope 对象中。NewSubScope() 方法会添加到该名称的所在的位置并返回一个新的 Scope。该名称的最后一个组件是使用 WithOpName() 方法设置的，与 Python 相同，默认为添加的操作类型的名称。Scope 对象被显式传递以指定上下文的名称。

封装

将生成的函数对某些操作私有也是有意义的，这使得封装函数可以做一些额外的逻辑。同时也提供了生成代码范围之外的功能的方法。

封装的一个用途是支持 SparseTensor 输入和输出。 SparseTensor 是一个由 3 个密集张量构成的元组：索引、值和形状。值向量的大小为 [n]，形状向量大小为 [rank]，索引矩阵的大小为 [n, rank]。有一些稀疏操作使用这个三元组来表示单个稀疏张量。

使用封装的另一个原因是某些操作需要记录状态。有一些操作（例如变量）具有在特定状态下的一些伴随操作。Python API 具有用于这些操作的类，其中构造函数创建操作，该类上的方法则是将操作添加到到图中并操作其状态。

其他考虑

有一个关键字列表，用于解决操作函数重命名与语言关键字（或其他会引起问题的符号，如代码中引用库函数或变量的名字）冲突。
将 Const 操作添加到图的函数通常是一个包装器，因为生成的函数通常会有冗余的 DataType 输入。

梯度、函数及控制流

目前，除了 Python 之外，其他语言并没有提供梯度、函数及控制流操作（if 和 while）。我们会在 C API 提供必要支持后更新。