前言
最近一直在做CTR预估的模型,为了应对大规模数据和导出更加易用的线上模型导出模型的问题,不得不放弃session,placehoder这种比较原始的tensorflow编码。使用更加高级的estimator api,说是高级api,让tensorflow编码更加简单,但是里面还是有不少的坑,在网上也找了各种案例,但还是太模式化,官方的教程也只针对简单的案例。这边为了避免重复工作,有比较好的教程,我直接放链接。本博客只作相应的补充和一些实用案例的展示。
关于tensorflow的api
关于这些api我会一一填坑。
关于estimator
带estimator的tensorflow代码,一般是如下图所示的流程
Input最好使用tf.data这个api去封装数据,这里面还涉及到feature_columns的api使用,能够简化tensorflow的特征工程的处理。这里面有一系列比较优秀的博客,我都会逐一放上相应的博客。
estimator的简介:
Estimator类是机器学习模型的抽象,其设计灵感来自于典典大名的Python机器学习库Scikit-learn。Estimator允许开发者自定义任意