kuka multi-object grasp task based on DDPG

Environment

环境部分都是从这个benchmark摘出来的. 对环境做了修改:

框架扩充：

(mpi对于交互开销不大的环境，并不会加快训练，反而会因为网络的同步更新，拖慢训练速度。)

算法部分可以选择标准DDPG 和如下improvements之一

./run_bash.sh

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
.idea		.idea
algorithm		algorithm
env		env
.gitignore		.gitignore
README.md		README.md
demo_collection.py		demo_collection.py
mem		mem
run.py		run.py
run_bash.sh		run_bash.sh
run_bash4.sh		run_bash4.sh
run_segment.sh		run_segment.sh
test.py		test.py
test.sh		test.sh