数学史

时间轴ß

  • 公元前580年 毕达哥拉斯
    • 这个学派企图⽤数来解释⼀切,不仅仅认为万物都包含数,⽽且说万物都是数。
    • 发现勾股定理(毕达哥拉斯定理)
    • 把算数和⼏何图形结合起来
    • 正多面体最多有5种 4,6,8,12,20
    • ⾸创地圆说,认为⽇、⽉、五星都是球体
  • 希波战争后,雅典的巧辩学派提出了几何作图的三大问题(只使用没有刻度的尺规):
    1. 三等分任意角
    2. 倍立方 - 求作一个立方体,使其体积等于一直立方体的两倍
    3. 化方为圆 - 求作一个正方形,使其面积等于已知圆
  • 欧几里得
  • 公元前427-347 柏拉图,
    • 圆锥曲线、抛物线、椭圆、双曲线
  • 亚里士多德 (柏拉图学生)
  • 原⼦论学派
    • 以德谟克⾥特为代表的原⼦论学派认为,线段、⾯积和⽴体是由许多不可再分的
      原⼦所构成。计算⾯积和体积,等于将这些原⼦集合起来。这种不甚严格的推理⽅法却是古代数学
      家发现新结果的重要线索。(挺有道理的啊,极限、采样就是这种思想吧)
      -
  • 17世纪出现的解析⼏何学、微积分学

毕达哥拉斯

毕达哥拉斯学派试图用数来解释一切

  • 0.9999…和1相等吗?为什么?
  • 整数和偶数都是无限的,数量一样多吗?有什么深层次的意义?

python3

python3buhui zhixing daduoshu zhendui python2解释器所写的旧代码。

在过去的数年里,python稳定性得以保持的主要原因之一就是,核心开发团队保持python后向兼容性的坚定决心(python2能正常运行python1.5.2的软件)。然而,创造者Guido van Rossum、Andrew Kuchling以及其他用户发现了某些“粘性”缺陷(存在于不同版本之间的问题)。需要发行一个包含重大变化的版本以确保该语言的明显进步。
2008年发行的python3.0版本,标志着故意打破后向兼容性原则的python解释器第一次发布。

python3有哪些变化

  1. print变成了print()
  2. 字符串默认转换为Unicode编码
  3. 增加了一个单类(single class)类型
  4. 更新了异常的语法
  5. 更新了整数
  6. 迭代无处不在

print变成了print()

为什么要将其从一条语句变化成一个内置函数(BIF)呢?
因为

  1. 将print作为声明会在很多方面受到限制。
  2. print作为语句将闲置对它的改进。而作为print(),
    就可以添加新的关键字参数,能够利用关键字参数覆写某些标准行为,并且也可以根据需求来替代print()

TODO:加入更多例子

字符串默认转换为Unicode编码

深度前馈序列记忆网络(DFSMN)

近日,阿里巴巴达摩院机器智能实验室开源了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%(这一数据测试基于世界最大的免费语音识别数据库LibriSpeech)。
对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。

阿里巴巴(科大的一位博士)张世良搞

阿里巴巴达摩院机器智能技术实验室语音识别团队于即日推出了新一代语音识别模型——DFSMN,与此同时团队已将这一模型开源。

深度前馈序列记忆网络(DFSMN) 使用基于 BLSTM 的统计参数语音合成系统作为基线系统,采用广泛使用的跳跃连接技术,在执行反向传播算法时,梯度可以绕过非线性变换。而官方介绍,对比目前业界使用最为广泛的 LSTM 模型,训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了 3 倍,语音识别速度提高了 2 倍。

模型

DFSMN≈TDNN+ResNet

就是一个普通的全链接模型+残差记忆模块参数特别难调

扩展阅读

可能出现的问题

OOM

:最好先增加下 swap 的空间:

1
2
3
4
5
6
# 生成swap镜像文件
sudo dd if=/dev/zero of=/mnt/1024Mb.swap bs=1M count=1024
# 对该镜像文件格式化
sudo mkswap /mnt/1024Mb.swap
# 挂载该镜像文件
sudo swapon /mnt/1024Mb.swap

使用free -m 即可查看到swap空间已经增加成功

bazel的作用

1
2
3
4
5
6
7
8
9
# 从github下载tensorflow源代码
git clone --recursive https://github.com/tensorflow/tensorflow

## 进入根目录后编译
# 编译生成.so文件, 编译C++ API的库 (建议)
bazel build //tensorflow:libtensorflow_cc.so

# 也可以选择,编译C API的库
bazel build //tensorflow:libtensorflow.so

特征工程方法

输入一句话,把每个字拼音标出来,涉及到多音字。
用分类器做预测。两个改进:1. 特征优化、筛选。 2. 训练语料增加数据。
窗口大小是5,前后各一个词。

线性分类,对简单的多音字。作为、为什么。
交叉熵效果不太好,就用SVM。没读多少相关paper。
前后的拼音不重要,词性重要。没有加语义特征?没
句法分析的结构。

其他方法