RNN Basic and Modern Architecture
在分类、回归等任务中(eg. 点击率预估、图像类别预估),给定特征$X$后,预估固定的目标$y$,例如在点击率预估任务中,$y$有两种选择:点击、不点击。 而现实中,我们经常有需要预估一个结构化的目标的需求,例如给定一个图片,自动描述其内容;给定一句中文,自动翻译出其英文表达;给定一段音频,自动识别 出不同语言的...
在分类、回归等任务中(eg. 点击率预估、图像类别预估),给定特征$X$后,预估固定的目标$y$,例如在点击率预估任务中,$y$有两种选择:点击、不点击。 而现实中,我们经常有需要预估一个结构化的目标的需求,例如给定一个图片,自动描述其内容;给定一句中文,自动翻译出其英文表达;给定一段音频,自动识别 出不同语言的...
训练深度的神经网络在指定的时间内收敛是困难的。BatchNorm和LayerNorm是加速深度网络收敛的正则化技术,广泛应用于现代的视觉和自然语言处理领域。 接下来我们将介绍其细节、区别、使用位置以及应用场景。
卷积神经网络(CNN)是深度学习发展过程中不可忽视的重要结构之一,在图像处理领域,是以深度学习为基础的方法的基础结构。 本文意在梳理CNN的基本原理和现代演进结构,巩固基础,展望未来。
快速选择算法基于两种partition算法(Lomuto,Hoare)实现,在两种不同的partition算法会产生完全不同的算法实现,深入了解不同的划分方式差异,对算法理解和实现有重要作用。 接下来将从pivot选择、机制、pivot最终位置、性能和稳定性上分析两者不同。
Latex Guide Markdown Guide Use Latex in Markdown
Latex Guide Markdown Guide Use Latex in Markdown
For beginners Focus on theory Dive Into Deep Learning by Mu Li Focus on practice Reproduce GPT-2 by Andrej karpathy with a 4-hours video on YouTu...
For beginners Focus on theory Dive Into Deep Learning by Mu Li Focus on practice Reproduce GPT-2 by Andrej karpathy with a 4-hours video on YouTu...
公交车上有一排 n 个座位,这一排的 n 个座位有个规定:乘客选中落座的前后位置,不允许坐人。即如果某位置的相邻位置有其他乘客,则该座位不会被选择。1 号座位与 2 号相邻,n 号座位与 n-1 号相邻,除了 1 号与 n 号座位,任意 i 号座位都与 i-1 和 i+1 号座位相邻。乘客源源不断的依次上车,每次...
公交车上有一排 n 个座位,这一排的 n 个座位有个规定:乘客选中落座的前后位置,不允许坐人。即如果某位置的相邻位置有其他乘客,则该座位不会被选择。1 号座位与 2 号相邻,n 号座位与 n-1 号相邻,除了 1 号与 n 号座位,任意 i 号座位都与 i-1 和 i+1 号座位相邻。乘客源源不断的依次上车,每次...