2018年总结–2019年的计划

在2018年开始的时候,自己给整一年立了一个Flag:2018年的第一个FLAG

2018Flag

现在2019年初来整理下2018年做了些什么

生信相关知识比较杂,从简单的来说,其中一点是可以认为是生信分析方法,这一年的空余时间主要看了些甲基化芯片分析方法、蛋白质谱的一些开源软件、转录组(一些非常规分析方法)以及全外显子分析(肿瘤)等,感觉大部分时间都在划水,只是简单的看些文献以及文档等

统计方面还是比较匮乏,只是了解了些基础概念性问题,统计书籍还是以睡前娱乐为主:生物统计学、深入浅出统计学、白话统计以及赤裸裸的统计学(除了第一本外,其他均可认为是科普读物。。。)。StatQuest课程没认真看过,主要是靠生信菜鸟团公众号的StatQuest生物统计学专题(感谢小编们的分享)

年初的时候把学习Python放在第三位,其实那时打算在年中前就可以学习,结果拖着拖着就到年底才开始动手,而且还是需求驱动(想用Python的docx包来写个自动化出报告的小工具),现在Python还处于用于写小脚本的程度,基本上能代替之前Perl做的所有工作,但是有时如果讲究快捷的话,还是会用Perl来写脚本(比如10分钟内的脚本,或者用一遍后就丢的那种);至于数据分析的方面,未使用Python,还是以R为主;至于用Python开发一个工具这个更是没完成。。。

年中的时候在整理GSEA使用方法的时候,将GSEA基本用法写成了一个R包-写了一个siGSEA包,基本了解了R包的基础组成部分以及写个简单的R包的思路,学习书籍-R包开发(中文版哈),然后后续再没深入了。。。成了2018年第一个R包也是当年的最后一个

我一直想把我写的shiny程序放到自己的网站上,但是由于自己的网站是基于虚拟云的(省钱),所以一直无法配置shiny的基本环境;所以今年写了好多个shiny app,但是都是以脚本形式保存;由于今年工作上的需求,用shiny写了基于内网搭建的生信小工具,几乎把shiny官网的上的文档http://shiny.rstudio.com/articles/翻了几遍,简单说下自己的感觉:

Shiny的开场白:不需要你了解HTML/CSS,只需要会R,即可以玩转shiny。。。这句话确实没错!但是,如果你想做一个界面美观的,交互流畅的网页工具(或者说一个交互网页工具),那么HTML/CSS基础知识是必学的,而且熟练的话,你可以在shiny的CSS代码上更改(因为shiny默认的样式真的不好看,个人觉得)。如果想设计一点交互性更好的网页,那么Javascript也是必不可少的工具(或者说是IT前端的基础知识都要看上一遍。。。),还可以多看看别人的shiny包代码以及文档,可以学习下。如果是仅仅做个交互工具,不讲究效用以及美观的话,那么简单学下shiny使用方法即可,其将一些常用的HTML/CSS代码以及JS代码都写成了R函数,调用即可

生信相关的算法这个就略过吧

总结下2018年做了啥:

  1. 学了点常规的生信分析方法,了解了些NGS肿瘤分析(WGS/WES/Rnaseq)的一些方法
  2. 用R学习了一些统计学方法,写了个R包和一些shiny程序,用R的markdown来编写网页版报告
  3. 初步接触了下Python以及一些包的用法
  4. 博文68篇,平均每月5-6篇,低于2017年的平均每月9-10篇
  5. 阅读了编程(R/Python/Shell)/统计学/算法/科普等相关书籍,看的最多的是编程R语言相关的,看的最少的是算法。。。

2019年想做些什么:

  1. 首先把Python提上进程,这个是基础,因为一些计划都需要用到Python,一般需要持续的学习,另外把2018年的一些漏缺补上
  2. 希望自己能搭一个简单的生信网页工具(或者说简易版的生信云平台),想学习一个前端框架,然后后端用Python;如果不行的话,就尝试用Galaxy等开源框架来搭建
  3. 继续了解些NGS在肿瘤分析中的方法,保持阅读肿瘤相关方向的文献阅读
  4. 系统学习下机器学习在临床方面的分析方法,进一步了解一些常见的机器学习方法
  5. 想从基础上补下编程能力,打算看下C++,尝试着用于加快一些R代码
  6. 如果有机会想系统的了解下生信在临检方面的应用
  7. 想写一个比较有意思的生信开源工具
  8. 如有新想法,待补充

最后最近一直在想一个问题,学生信的人到底能做什么;从专业上来讲,生物信息学是一个交叉学科,是生物学和计算机学交叉的产物,主要用于应对现在生物学上(主要是NGS)一些大数据的分析;从应用来说,其分布在一些科研院校、科研服务类公司、基因临床检测公司以及一些药企等;从就业的角度来看,有些人侧重于计算机知识的积累,从事于一些生信开发工作,有些人侧重于生物学相关数据的分析工作,还有些是一些公司生信产品的设计等等;从我的角度来看,大致其实可以分为软件开发和数据分析两种,个人觉得生信产品设计之类的都是前面两者的一种延伸,类似于IT行业的产品经理等等

如果是喜欢生信数据分析、数据挖掘,那么一般会紧靠生物相关公司,大概率会从事一些科研服务类工作,或者一些药企等;如果是喜欢生信开发,一般对于计算机背景要求较高,也就是要有IT基础,有独立开发软件的能力,会在一些有自主发开能力的基因临床检测公司或者就直接转向IT行业了。。。

所以学生信的到底能做什么,取决于你的基本技能有哪些,更加在于你想做些什么

最后推荐一些2018年看过觉得不错的书籍以及一些工具书(翻翻就行)

  • R语言经典实例
  • R包开发
  • 白话统计
  • Python基础教程(第三版)
  • 机器学习(周志华)
  • 算法图解
  • 基因传

本文出自于http://www.bioinfo-scrounger.com转载请注明出处