* **困难**:计算量过大,每次推理都需要用到数据库所有的数据,而且准确率很低
### 真正的解决办法——Deep Metric Learning
**深度度量学习(deep metric learning)**的目标是学习一个从原始特征到低维稠密的向量空间(称之为嵌入空间,embedding space)的映射,使得同类对象在嵌入空间上使用常用的距离函数(欧氏距离、cosine距离等)计算的距离比较近,而不同类的对象之间的距离则比较远。深度度量学习在计算机视觉领域取得了非常多的成功的应用,比如**人脸识别、人脸验证、图像检索、签名验证、行人重识别等**以及最新的**one/few-shot/meta learning**上的应用。<br>
**深度度量学习(deep metric learning)**的目标是学习一个从原始特征到低维稠密的向量空间(称之为嵌入空间,embedding space)的映射,使得同类对象在嵌入空间上使用常用的距离函数(欧氏距离、cosine距离等)计算的距离比较近,而不同类的对象之间的距离则比较远。深度度量学习在计算机视觉领域取得了非常多的成功的应用,比如**人脸识别、人脸验证、图像检索、签名验证、行人重识别等**以及最新的**one/few-shot/meta learning**上的应用。<br>
#### 如何使用DML进行图像分类?
<img src="./md_imgs/DML/mnist.png" alt="image" style="zoom:50%;" /><img src="./md_imgs/DML/dml_eg.jpg" alt="image" style="zoom: 67%;" />
### 支付宝是怎么做到快速从数亿张脸中找到我的脸的?
**简单来说就是 预处理+编码为向量 + 先验条件缩小搜索范围 + 高效率的向量相似度搜索的算法(Facebook的Faiss)**
......@@ -31,30 +32,61 @@
* 并行化及专用芯片加速:将搜索过程交给高度并行化的算法及服务器或者专用的加速芯片
* 兜底策略:输入手机尾号
## DML-Algorithm
### General Pipeline
* 1.将Sample mini-batch(一般是C类每类挑K个,共N个数据)提取网络来map embedding
* 1.将Sample mini-batch(一般是C类每类挑K个,共N个数据)提取网络来map embedding然后通过L2-normalization来归一化网络的输出
* 2.将每个数据都依次作为anchor(锚点)并使用采样策略组成多个sub-set
* 3.在每个sub-set上计算loss
### Embedding
* network
* L2-normalization
<div align="center">
<img src="./md_imgs/DML/L2-normalization.jpg" alt="image" style="zoom:50%;" />
<img src="./md_imgs/DML/L2-normalization_cos.jpg" alt="image" />
### Loss
#### 1.Contrastive loss
![image](./md_imgs/DML/Contrastive loss.jpg)
**contrastive loss只考虑了输入样本对本身的相似性**
#### 2.Triplet loss
![image](./md_imgs/DML/Triplet loss.jpg)
**Triplet-Loss的效果比Contrastive Loss的效果要好,因为他考虑了正负样本与锚点的距离关系。**
#### 3.N-pair-ms loss
#### 3.N-pair-ms loss
![image](./md_imgs/DML/N-pair-ms loss.jpg)
#### other
Margin Based Loss, Lifted Struct loss, Proxy NCA loss, Ranked list loss, Multi-Similarity loss
### Sampling matters
### Experiment Setting
#### 1.Naive sampling
按loss里面的项每一对样本都算距离,那么就是NXN对. 对triplet loss来说就是正样本两两之间然后再随机采样一个负样本,也是NXN个triplet
#### 2.Semi-hard sampling
#### 3.N-pairs sampling
#### other
Softhard Sampling, Distance weighted sampling...
### Experiment Setting
* Dataset: Stanford Online Products, CARS196, and the CUB200-2011
* Eval:一般是Recall@K和NMI(一般用k-means聚类)(For Recall@K,Each test image (query) first retrieves K nearest neighbors from the test set and receives score 1 if an image of the same class is retrieved among the K nearest neighbors and 0 otherwise. Recall@K averages this score over all the images \cite{lifted}.NMI is normalized mutual information to evaluate the clustering result with given ground truth clustering . and denotes mutual information and entropy respectively.)
## Reference
[1]打个酱油, Deep Metric Learning, https://zhuanlan.zhihu.com/p/68200241
[2]赵赫 Mccree, Face Recognition Loss on Mnist with Pytorch, https://zhuanlan.zhihu.com/p/64427565
[3]杨旭东, 深度度量学习中的损失函数, https://zhuanlan.zhihu.com/p/82199561
[4]find goo, 支付宝是怎么做到快速从数亿张脸中找到我的脸的?,https://www.zhihu.com/question/359431172/answer/935555297
[5]face_recognition, ageitgey, https://github.com/ageitgey/face_recognition#face-recognition
[5]ageitgey, face_recognition, https://github.com/ageitgey/face_recognition#face-recognition
[6]NIPS'2016, Improved Deep Metric Learning with Multi-class N-pair Loss Objective
[7]ICCV'2017, Sampling Matters in Deep Embedding Learning
[8]Confusezius, Deep-Metric-Learning-Baselines, https://github.com/Confusezius/Deep-Metric-Learning-Baselines
## 插入链接图片
## 插入链接图片
插入网络图片:![](网络图片链接地址),即叹号!+方括号[]+括号(),如果不加叹号!就会变成普通文本,方括号里可以加入一些 标识性的信息
* 插入网络图片:![](网络图片链接地址),即叹号!+方括号[]+括号(),如果不加叹号!就会变成普通文本,方括号里可以加入一些 标识性的信息
![baidu](http://www.baidu.com/img/bdlogo.gif "百度logo")
<img src=http://www.baidu.com/img/bdlogo.gif style="zoom:50%">
* 插入GITHub仓库里的图片:![](图片链接地址),即叹号!+方括号[]+括号(),URL写法:http://github.com/自己的用户名/项目名/raw/分支名/存放图片的文件夹/文件夹里的图片名字
* 给图片加上超链接:即点击一个图片进入指定网页,方括号里写自己起的标识名称,上下两行标识要一致。
[baidu]:http://www.baidu.com/img/bdlogo.gif "百度Logo"
[baidu]:http://www.baidu.com/img/bdlogo.gif "百度Logo"<br>
* 图片居中
<div align="center">
<img src="http://www.baidu.com/img/bdlogo.gif " alt="image" style="zoom:50%;" />
## 插入代码片段
### 用户
* 添加用户
#### 查看当前所有用户
cat /etc/passwd
#### 添加用户
sudo adduser hypo
* 更改密码
#### 更改密码
sudo passwd hypo
* 更改用户权限
#### 更改用户权限
cd /etc
sudo vim sudosers
* 删除用户
#### 删除用户
sudo userdel -r hypo
### 文件夹权限
chmod -R 777 hypo #4是读权限,2是写权限,1是可执行权限,777就是所有权限都开,766或776才是开放其他用户的读写权限,777是开放所有权限
chmod -R 777 / #开放整个系统所有权限,完蛋
chown -R mysql / #锁死所有权限,完蛋
### 安装显卡驱动
sudo add-apt-repository ppa:graphics-drivers/ppa
......@@ -25,7 +35,23 @@ sudo apt update
ubuntu-drivers devices#选择推荐的驱动版本
sudo apt install nvidia-430
### 挂载U盘
### 分区/挂载U盘/硬盘
#### 分区
fdisk -l
#device Start End Sectors Size Type
fdisk /dev/sdb
#输入p 查看当前硬盘分区,目前没有分区
#输入n新建一个分区,输入p 建立分区,输入分区编号 1
#最后保存分区 输入w
mkfs.ext4 /dev/sdb1
#### 挂载
root@lthpc:/home/hypo# fdisk -l
......@@ -34,14 +60,14 @@ Device Start End Sectors Size Type
root@lthpc:/home/hypo# cd /media
root@lthpc:/media# mkdir usb
root@lthpc:/media# mount -t ntfs-3g /dev/sdc1 /media/usb
# ext4 ext2 xfs
$ umount /dev/hda2
$ umount /usr
### linux应用设置
* goldendict
#### goldendict
# 安装
sudo apt install goldendict
......@@ -75,13 +101,13 @@ ps aux|grep python|grep -v grep|cut -c 9-15|xargs kill -15
#“kill -15”会正常退出指定进程,-9强行杀掉
### 常用系统命令
* 删除文件
#### 删除文件
rm -rf yourdir
#-r 就是向下递归,不管有多少级目录,一并删除
#-f 就是直接强行删除,不作任何提示的意思
rm -rf yourdir#-r 就是向下递归,不管有多少级目录,一并删除 -f 就是直接强行删除,不作任何提示的意思
find -name "*.pth" -delete #批量删除后缀为pth的所有文件
* cp mv
#### cp mv
# cp复制  mv剪切
cp [options] <source file or directory> <target file or directory>
......@@ -100,7 +126,7 @@ cp -rf dir1 dir #复制文件夹dir1到dir2,不显示进度
#-s 复制成符号连结文件 (symbolic link),亦即『快捷方式』档案;
#-u 若 destination 比 source 旧才更新 destination。
* deb
#### deb
sudo apt-get install -f #解决依赖关系
dpkg -i <package.deb> #安装一个 Debian 软件包,如你手动下载的文件。
......@@ -133,6 +159,10 @@ $ sudo systemctl enable teamviewerd.service
### 压缩解压
安装:apt-get install p7zip-full
解压7z:使用方法:7z x file.7z
#.tar .tar.xz
tar xvf filename.tar #.tar 解包
tar cvf filename.tar dirname #.tar 打包
......@@ -165,8 +195,9 @@ tar cvf - test.txt | pigz > test.tar.gz
tar -I pigz -xvf /path/to/archive.tar.gz -C /where/to/unpack/it/
### rdesktop(Windows远程桌面)
rdesktop -u Administrator -p password ip -g 1280x720
-r sound:local:alsa #远程声音
### vim
* 模式
......@@ -177,6 +208,7 @@ rdesktop -u Administrator -p password ip -g 1280x720
* 保存退出
保存退出都要在命令模式下完成。保存用 :w path/to.txt,退出用 :q。如果是编辑已经存在的文件可以直接用 :wq 退出。
### ssh
#### install & run
* install
sudo apt-get install openssh-client
......@@ -203,7 +235,7 @@ ssh -p 1234 hypo@
* exit
#orchmod -R 777 /home/mypackage
* ssh-keygen
......@@ -219,7 +251,7 @@ nohup python3 a.py &
firefox &
* transmit files
#### transmit files
#压缩+解压流传输 把本地的文件复制到远程主机上
tar -c './dir' |pigz |ssh hypo@ "gzip -d|tar -xC /home/hypo/MyProject"
......@@ -257,6 +257,7 @@ args , _ = parse.parse_known_args(sys.argv[1:])
SAVEDIR = args.savedir
## numpy
* zeros/ones
np.zeros(shape, dtype=float, order='C')
......@@ -285,6 +286,8 @@ a.reshape #修改形状
data = data[np.argsort(data[:,0])]
## scipy
## pyinstaller
......@@ -362,6 +365,7 @@ cv2.imshow("Green", cv2.merge([zeros, G, zeros]))
cv2.imshow("Red", cv2.merge([zeros, zeros, R]))
## matplotlib
### colors markers
colors= ['blue','orange','green','red','purple','brown','pink','gray','olive','cyan']
