Jupyter Notebook

Jupyter Notebook平时接触倒是不少,一些machine learning course以及Git hub上的代码都会用Jupyter notebook来展示;因此打算用Jupyter notebook将之前Python实现Statistical learning method书中的算法简单整理一下

Github地址:https://github.com/kaigu1990/Statistical-Learning-Method-Notes

Jupyter Notebook主要是一种基于Web 的,用于编写交互式文档的工具;类似于R语言中的R markdown,相当于一种mathematical的notebook,可以实时查看代码运行结果,并且可以做的事情很多,涉及数据分析、数据可视化以及机器学习等方面;同时在数据挖掘Kaggle里的资料都是基于Jupyter,里面的Kaggle学习教程也是基于Jupyter展示的。另外还有个作用是便于分享,是理念跟R markdown一样。。。。

Jupyter notebook虽然在Python中见的比较多,但是其实际上支持数十种编程语言,至少R是没问题的,其他没试过。。。

jupyter的安装参照官网方法Installing Jupyter Notebook

  • 使用Anaconda,这个方法个人比较喜欢,因为方便,因为直接内置多个软件,包括了jupyter以及Spyder等IDE
  • 使用pip安装,常规Python安装模块的方法:pip3 install --upgrade pippip3 install jupyter

启动比较简单,在cmd中直接输入jupyter notebook;如果想将.ipynb文件输出到指定目录下,则先cmd到指定目录下,然后再启动jupyter

接着则是jupyter notebook的使用了,我是参考这两篇文章Getting started with the Jupyter notebook (part 1)Getting started with the Jupyter notebook (part 2),网上也有很多使用教程,看下一般就会了

简单熟悉下notebook界面的组成部分,主要是菜单和一些选项;最常用的则是下方的代码单元格(code cell),以[]开头,可输入任意代码,然后Shift+Enter(运行本单元格并切到下个单元格)或者Ctrl+Enter(运行本单元格)

除了code cell外,notebook还可以使用其他类型单元格,比如markdown,点击下拉框(默认是code),还有:

  • Markdown,文本输入的地方
  • Raw NBConvert,将notebook转化为其他格式
  • Heading,加标题,已集成到markdown里,使用对应语法即可

然后了解下几个对单元格操作的常用快捷键,需要先区别两个键盘输入模式:命令和编辑,两者可以通过EscEnter进入(蓝色左边框代表命令模式,绿色左边框代表编辑模式)

已有人整理好的,翻一翻即可;Jupyter :快捷键以及Cheat Sheet

此外,jupyter还有丰富的插件可供使用。。。

如果想用一个集成的IDE,那么JupyterLab或许可以满足需求。。。

PS. 有时在Github上打开ipynb文件很慢,网上已有人给出了个解决办法,如解决Github加载ipynb文件缓慢/失败。。

解决办法大致如下:

  • 利用https://nbviewer.jupyter.org/ 可以快速加载ipynb文件
  • 将你需要打开Github上的ipython网址中,https://github.com/后面的地址和https://nbviewer.jupyter.org/拼起来即可

本文出自于http://www.bioinfo-scrounger.com转载请注明出处