1)先从label提取70多种特征(5因子,声调,前后信息等等),再又HMM提取一个粗糙的时长模型定位字的大致范围。
2) 对语音提取频谱特征和基频特征
3) 声学训练对齐,HHM状态为语言特征序列,单高斯为频谱特征
4 )参数生成过程为 :已知模型参数a,求P(O|a),频谱参数。具体地,phone经过决策树查询聚类的均值和方差,然后求P(O|a)。

常用的html版式

字体

图片样式

  • ![], 缺陷,不方便自定义size和title
  • 排版
1
2
![convs2s的batch training过程](/images/raw/NN - convseq2seq - architecture.png)
这种样式只加了alt属性,并未加title属性

Illustration of batching during training
convs2s的batch training过程

convseq2seq的卷积过程

convseq2seq的卷积过程

背景切换

图片大小

多张图片

yield return

python在

yield 从字面上理解有“退位,屈服”的意思,转一下弯就理解成“权限转移”,也就是将控制权交给别人,在这里就是把集合里满足条件(如果没有过滤条件,就是全体)的个体的操作转移给另一个对象。

第一种方法,是把结果集全部加载到内存中再遍历;

第二种方法,客户端每调用一次,yield return就返回一个值给客户端,是”按需供给”。

yield与装饰器、yield并发切换(非io)

其他语言中的yield

java - yield

Thread.yield( )

使当前线程从执行状态(运行状态)变为可执行态(就绪状态)。cpu会从众多的可执行态里选择,也就是说,当前也就是刚刚的那个线程还是有可能会被再次执行到的,并不是说一定会执行其他线程而该线程在下一次中不会执行到了。

Java线程中有一个Thread.yield( )方法,很多人翻译成线程让步。顾名思义,就是说当一个线程使用了这个方法之后,它就会把自己CPU执行的时间让掉,让自己或者其它的线程运行。

使当前线程(即调用该方法的线程)暂停执行一段时间,让其他线程有机会继续执行,但它并不释放对象锁。

该方法与sleep()类似,只是不能由用户指定暂停多长时间,并且yield()方法只能让同优先级的线程有执行的机会。

C

C#中的yield关键字的用法经常是 yield return

nodejs

互信息和左右熵的新词发现

是由Matrix67牛人提出来的,实现的方式也有很多人解决了。我只是写个最简单的介绍和实现方式给自己做做笔记罢。该算法最主要是基于互信息和左右熵的计算规则,而这两个概念都是出自信息论的范畴,其一者称内部凝和度,其二者称外部自由度或者边界自由度。

第一是最小互信息,因为互信息越大说明相关度越大,将n-gram分好的词计算互信息,如果低于阈值,则说明不能成词。

第二是最小熵值,因为熵也是越大说明周边词越丰富,计算其左熵和右熵的最小值,如果最小值低于阈值,则说明不能成词。

第三个是最少出现次数,为什么有这个数呢?假设前后两个词是完全相关的,出现400次,总共8000词,那么互信息=log((400/8000)/(400/8000)(400/8000)),约掉之后剩下log(8000/400)。但是一个词如果从头到尾出现了一次,但是并不是单词,则互信息为=log((1/8000)/(1/8000)(1/8000))=log(8000/1),那么它的互信息会更大。取最少出现次数也会出现问题,就是一些低频率的词不能发现。

【Linux网络编程】原始套接字

通常情况下程序员接所接触到的套接字(Socket)为两类:

  1. 流式套接字(SOCK_STREAM):一种面向连接的 Socket,针对于面向连接的TCP 服务应用;
  2. 数据报式套接字(SOCK_DGRAM):一种无连接的 Socket,对应于无连接的 UDP 服务应用。

从用户的角度来看,SOCK_STREAM、SOCK_DGRAM 这两类套接字似乎的确涵盖了 TCP/IP 应用的全部,因为基于 TCP/IP 的应用,从协议栈的层次上讲,在传输层的确只可能建立于 TCP 或 UDP 协议之上,而 SOCK_STREAM、SOCK_DGRAM 又分别对应于 TCP 和 UDP,所以几乎所有的应用都可以用这两类套接字实现

但是,当我们面对如下问题时,SOCK_STREAM、SOCK_DGRAM 将显得这样无助:

  1. 怎样发送一个自定义的 IP 包?
  2. 怎样发送一个 ICMP 协议包?
  3. 怎样分析所有经过网络的包,而不管这样包是否是发给自己的?
  4. 怎样伪装本地的 IP 地址?

这使得我们必须面对另外一个深刻的主题——原始套接字(SOCK_RAW)。原始套接字广泛应用于高级网络编程,也是一种广泛的黑客手段。著名的网络sniffer(一种基于被动侦听原理的网络分析方式)、拒绝服务攻击(DOS)、IP 欺骗等都可以通过原始套接字实现。

原始套接字(SOCK_RAW)可以用来自行组装数据包,可以接收本机网卡上所有的数据帧(数据包),对于监听网络流量和分析网络数据很有作用。

原始套接字是基于 IP 数据包的编程(SOCK_PACKET 是基于数据链路层的编程)。另外,必须在管理员权限下才能使用原始套接字

原始套接字(SOCK_RAW)与标准套接字(SOCK_STREAM、SOCK_DGRAM)的区别在于原始套接字直接置“根”于操作系统网络核心(Network Core),而 SOCK_STREAM、SOCK_DGRAM 则“悬浮”于 TCP 和 UDP 协议的外围。

转载自 https://blog.csdn.net/tennysonsky/article/details/44655077
写的太好了,no comments