2018-07-21

【Docker系列】Docker的存储

简介

https://docs.docker.com/storage/storagedriver/

每个Docker镜像（Image）都引用了一些只读的（read-only）层（layer），不同的文件系统layer也不同。这些layer堆叠在一起构成了容器（Container）的根文件系统（root filesystem）。

当你基于Ubuntu 创建一个新的容器的时候，你其实只是在它的上层又增加了一个新的、薄的、可写层。这个新增的可写层称为容器层（container layer）。当这个新的容器运行时，所有的改动（比如创建新文件、修改已有文件、删除文件等）都会写到这一层。

存储 - 镜像层(Layers)

镜像层依赖于一系列的底层技术，比如文件系统(filesystems)、写时复制(copy-on-write)、联合挂载(union mounts)等

docker的镜像分层技术

容器层是可写层。

例如：
docker history tensorflow/tensorflow:1.8.0-gpu

tensorflow的镜像分层

写时拷贝策略(CopyOnWrite)

CopyOnWrite容器即写时复制的容器。通俗的理解是当我们往一个容器添加元素的时候，不直接往当前容器添加，而是先将当前容器进行Copy，复制出一个新的容器，然后新的容器里添加元素，之后再将原容器的引用指向新的容器。这样做的好处是我们可以对CopyOnWrite容器进行并发的读，而不需要加锁，因为当前容器不会添加任何元素。所以CopyOnWrite容器也是一种读写分离的思想，读和写不同的容器。

缺点

内存占用问题：
在进行写操作的时候，内存里会同时驻扎两个对象的内存，旧的对象和新写入的对象（注意:在复制的时候只是复制容器里的引用，只是在写的时候会创建新对象添加到新容器里，而旧容器的对象还在使用，所以有两份对象内存）。
docker的什么操作会写容器？不涉及文件写操作的会涉及到容器的写操作吗？只有commit操作会写操作？
数据一致性问题

COW的应用

CopyOnWrite容器非常有用，可以在非常多的并发场景中使用到。

COW在java

从JDK1.5开始Java并发包里提供了两个使用CopyOnWrite机制实现的并发容器,它们是CopyOnWriteArrayList和CopyOnWriteArraySet

COW在C++

C++的STL中，曾经也有过Copy-On-Write的玩法，参见陈皓的《C++ STL String类中的Copy-On-Write》，后来，因为有很多线程安全上的事，就被去掉了。

数据持久化

配置本地镜像与容器的存储位置

默认情况下Docker的存放位置为：/var/lib/docker
可以通过下面命令查看具体位置：

1	docker info \| grep "Docker Root Dir"

解决这个问题，最直接的方法当然是挂载分区到这个目录，但是我的数据盘还有其他东西，这肯定不好管理，所以采用修改镜像和容器的存放路径的方式达到目的。

这个方法里将通过软连接来实现。

首先停掉Docker服务：

1
2
3

systemctl restart docker
或者
service docker stop

然后移动整个/var/lib/docker目录到目的路径：

1 2	mv /var/lib/docker /root/data/docker ln -s /root/data/docker /var/lib/docker

这时候启动Docker时发现存储目录依旧是/var/lib/docker，但是实际上是存储在数据盘的，你可以在数据盘上看到容量变化。

docker的挂载

unmount

系统文件夹使用的是devicemapper文件系统，可以用来限制容器的磁盘使用。

在devicemapper驱动下，多出两个文件，一个是 devicemapper 一个是metadata

文件目录

/var/lib/docker# ls
aufs
builder
buildkit
containerd
containers
image
network
plugins
runtimes
swarm
tmp
trust
volumes

Hexo