找回密码
 注nanjixiong2017册

QQ登录

只需一步,快速开始

发表帖子

Caffe学习系列(10):命令行解析

[复制链接]
如果以下命令不能执行请在执行语句前添加sudo

caffe的运行提供三种接口:c++接口(命令行)、python接口和matlab接口。本文先对命令行进行解析,后续会依次介绍其它两个接口。

caffe的c++主程序(caffe.cpp)放在根目录下的tools文件夹内, 当然还有一些其它的功能文件,如:convert_imageset.cpp, train_net.cpp, test_net.cpp等也放在这个文件夹内。经过编译后,这些文件都被编译成了可执行文件,放在了 ./build/tools/ 文件夹内。因此我们要执行caffe程序,都需要加 ./build/tools/ 前缀。

如:


  1. <p>[plain] view plain copy</p><p># sudo sh ./build/tools/caffe train --solver=examples/mnist/train_lenet.sh  </p>
复制代码


caffe程序的命令行执行格式如下:


  1. <p>[plain] view plain copy</p><p>caffe <command> <args>  </p>
复制代码


其中的<command>有这样四种:
train
test
device_query
time


对应的功能为:

train----训练或finetune模型(model),

test-----测试模型

device_query---显示gpu信息

time-----显示程序执行时间

其中的<args>参数有:

-solver
-gpu
-snapshot
-weights
-iteration
-model
-sighup_effect
-sigint_effect
注意前面有个-符号。对应的功能为:

-solver:必选参数。一个protocol buffer类型的文件,即模型的配置文件。如:

  1. # ./build/tools/caffe train -solver examples/mnist/lenet_solver.prototxt
复制代码


-gpu: 可选参数。该参数用来指定用哪一块gpu运行,根据gpu的id进行选择,如果设置为'-gpu all'则使用所有的gpu运行。如使用第二块gpu运行:

  1. # ./build/tools/caffe train -solver examples/mnist/lenet_solver.prototxt -gpu 1
复制代码


-snapshot:可选参数。该参数用来从快照(snapshot)中恢复训练。可以在solver配置文件设置快照,保存solverstate。如:

  1. # ./build/tools/caffe train -solver examples/mnist/lenet_solver.prototxt -snapshot examples/mnist/lenet_iter_5000.solverstate
复制代码


-weights:可选参数。用预先训练好的权重来fine-tuning模型,需要一个caffemodel,不能和-snapshot同时使用。如:

  1. # ./build/tools/caffe train -solver examples/finetuning_on_flickr_style/solver.prototxt -weights models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel
复制代码


-iterations: 可选参数,迭代次数,默认为50。 如果在配置文件文件中没有设定迭代次数,则默认迭代50次。

-model:可选参数,定义在protocol buffer文件中的模型。也可以在solver配置文件中指定。

-sighup_effect:可选参数。用来设定当程序发生挂起事件时,执行的操作,可以设置为snapshot, stop或none, 默认为snapshot

-sigint_effect: 可选参数。用来设定当程序发生键盘中止事件时(ctrl+c), 执行的操作,可以设置为snapshot, stop或none, 默认为stop

刚才举例了一些train参数的例子,现在我们来看看其它三个<command>:

test参数用在测试阶段,用于最终结果的输出,要模型配置文件中我们可以设定需要输入accuracy还是loss. 假设我们要在验证集中验证已经训练好的模型,就可以这样写

  1. # ./build/tools/caffe test -model examples/mnist/lenet_train_test.prototxt -weights examples/mnist/lenet_iter_10000.caffemodel -gpu 0 -iterations 100
复制代码


这个例子比较长,不仅用到了test参数,还用到了-model, -weights, -gpu和-iteration四个参数。意思是利用训练好了的权重(-weight),输入到测试模型中(-model),用编号为0的gpu(-gpu)测试100次(-iteration)。

time参数用来在屏幕上显示程序运行时间。如:

  1. # ./build/tools/caffe time -model examples/mnist/lenet_train_test.prototxt -iterations 10
复制代码


这个例子用来在屏幕上显示lenet模型迭代10次所使用的时间。包括每次迭代的forward和backward所用的时间,也包括每层forward和backward所用的平均时间。

  1. <p>
  2. </p><p># ./build/tools/caffe time -model examples/mnist/lenet_train_test.prototxt -gpu 0</p>
复制代码


这个例子用来在屏幕上显示lenet模型用gpu迭代50次所使用的时间。

  1. # ./build/tools/caffe time -model examples/mnist/lenet_train_test.prototxt -weights examples/mnist/lenet_iter_10000.caffemodel -gpu 0 -iterations 10
复制代码


利用给定的权重,利用第一块gpu,迭代10次lenet模型所用的时间。

device_query参数用来诊断gpu信息。

  1. # ./build/tools/caffe device_query -gpu 0
复制代码


最后,我们来看两个关于gpu的例子


  1. <p># ./build/tools/caffe train -solver examples/mnist/lenet_solver.prototxt -gpu 0,1</p><p># ./build/tools/caffe train -solver examples/mnist/lenet_solver.prototxt -gpu all</p>
复制代码


这两个例子表示: 用两块或多块GPU来平行运算,这样速度会快很多。但是如果你只有一块或没有gpu, 就不要加-gpu参数了,加了反而慢。

最后,在linux下,本身就有一个time命令,因此可以结合进来使用,因此我们运行mnist例子的最终命令是(一块gpu):


  1. <p>[plain] view plain copy</p><p>sudo time ./build/toos/caffe train -solver examples/mnist/lenet_solver.prototxt  </p>
复制代码
转自
mjiansun


使用道具 举报 回复
您需要登录后才可以回帖 登录 | 注nanjixiong2017册

本版积分规则