苦逼打工人返工了
本来此文是在敦煌返回成都的列车上写的,但是回成都后一系列事情搞得人身心俱疲,所以一直在拖,今天下午六点睡到九点多,想着把这些拖延的事情收个尾。
流水账
考完研后在学校里无聊了十多天,这段日子的反差感是真的大,每天都要跟室友说几句"好无聊啊,已经不知道玩什么了",考研之前总在想着考完后要做点什么什么,真正考完后倒没什么很想做的事了。每天就是玩手机玩电脑一直循环,接了农科院师兄的一些分析,也基本每天就写好脚本挂在集群上面跑。后面考完试就到成都开始进行毕业论文相关的事,我做的是机器学习,湿实验跟着师兄一早上就过了一遍,随后便是一些数据的下载、处理与分析,师兄带着我跑了一遍随机森林,我自己又跑了一遍 Xgboost,主体的部分就差不多了,后续无非就是多跑几种算法,再进行一下结果分析之类的。也临近去科伦实习的日子了,提着我的行李箱又慢悠悠晃到温江,办了入职。我属于转化医学中心,转化科学部,生物信息组,我的直属领导是一位南方医科大学的博士,我的主要工作内容就是使用 Vue 和 flask 开发一个 Web 应用,对接 alphafold3 等一系列生物的大模型,使得用户能够通过简单的 GUI 界面体检模拟与分析任务,算是全栈开发吧。
在此之前我是没有接触过这么大型的项目的,甚至 Vue 都没有用过,只能自己现在公司发的电脑上部署开发环境,自己先试着开了个小的项目,搞清楚 Vue 与 flask 之间的路由关系,随后便风风火火的开干了,得益于 AI 的加持,进度还算不错,目前主要开发的 alphafold3 功能已经趋近于完善,又开发了任务管理系统、用户系统、通知系统、错误反馈等模块。就是公司的堡垒机只能用网页 rdp,22 和 443 端口都被封了,不太方便,再就是公司发的笔记本性能太差,本地调试比较慢。
过年回家的前一天,我用京东国补买了一加 ace5,其他都好说,自带的 color OS15 实在一言难尽啊,自带的 shit 实在不少,初六那天找了 xda 的教程,解了 bl 刷成了国际版的氧 OS,自带谷歌全家桶,纯净无广告,实在安逸啊,不禁让人感叹,吃了这么多年粗粮,终于吃上细糠了。..,再用 adb 删掉没用的软件,终于是达到了理想的安卓状态,目前只发现自带相机 app 有经常性卡死的现象,其他没什么问题。
过年在家的日子实在是平常,每天就是睡到自然醒后,吃完饭就去玩,这些年已经不是很喜欢去走亲戚了,因为基本上和大人们没什么话题,基本上就是吃完饭就坐在那玩手机了,所以走亲戚能不去我就不去。然后就是和各种朋友聚餐、喝酒、打球,不得不说,是不是年龄大了,压根喝不动,喝几杯就难受,不过跟朋友在一起的日子还真是开心,大家一起聊聊天,吹吹牛,时间就过去了。
当然,也少不了带娃,许久不见,小伙子长高了很多,不过还是一样的黏我,成天缠着我跟他玩。
关于 AI
因为目前工作本身做的就是 AI 相关的,所以对 AI 还算比较关注,deepseek 凭借极强的推理能力,在过年这几天火速出圈,实际上我从几个月前就在用,包括实习期间辅助写代码也是用它,起初并没有感觉有什么很突出的,直到后面 ds 服务器一直繁忙,我就继续用 GPT,结果发现 GPT4 的推理能力确实不如 ds,很多问题都回答不上来,而 deepseek 的推理能力是真的强,很多问题都能回答上来,而且回答的还很详细,不过服务器繁忙的问题还是很恼人心态。有些代码 GPT 一直改不好,而用 ds 一下就改好了,不得不感叹,深度求索这确实强啊。回公司后,领导也让博士部署了本地模型,公司内部越来越多人用,每天都有很多人与博士交流相关的问题。不过国产嘛,总要有点特色,据油管的部分博主测试,在询问一些特殊的问题时,只要出现部分关键词,ds 会直接给出"官方回答",不过也有博主已经发现了"越狱"的教程,可以绕过官方的限制,使用一些特殊的方法来使用 ds,由于我没有这个硬件条件,也就没有试过了。据一些小道消息,说 OPENAI 目前的 AI 不必 ds 差,只不过是在挤牙膏,一点点放出来,ds 这一下把 OPENAI 逼急了,可能过不了多久就要放大招了。
生物大模型相关的目前了解的不多,目前主要还是在开发 alphafold3 的 Web 应用,后续会接触到一些模型开发工作,届时再去慢慢了解吧。
最近用了 cursor,给我的第一感觉就是,惊艳,实在是太强了,原生的交互比 VS 上那些所谓的代码扩展好了太多太多,当然,每个月 20 美元对我来说还是不便宜,于是就只能用临时邮箱+刷机器码插件,无限续杯免费版。不过我已经跟博士申请了,由公司订阅,估计这两天也就下来了。
关于开发
目前关于公司 web 平台的工作基本走上正轨了,很多模块都开发的差不多了,只不过对于 alphafold3 的部分 API 我还不是很清楚,后续慢慢也就解决了。
使用了 cursor 后,我就想着自己开发点小东西玩玩。最先开发的是一个 web 的 RSS 阅读器,纯前端实现,使用 GitHub actions 运行 python 程序更新源,然后评论和收藏功能就跳转到 GitHub 新建 issues,我是很喜欢 hackernews 的那种模式的,评论与文章本身是分开的,评论中有很多有价值的信息,于是我就效仿了这个模式,也恰好解决了没有后端无法实现评论和收藏的问题。最后发布到 v2ex 和 Linux Do,收到了一点反馈,我也进行了修改。今天睡醒之后又加了已阅读的功能,算是比较完善了,不过纯前端实现嘛,数据都在浏览器本地咯。
在某天完善 alphafold3 模拟结果可视化的时候,我突然想起前两天师姐让我帮忙看几个 cif 文件的结构图,她没有 pymol,就让我看看,想到这里,我就根据科伦平台上的一些实现,重写了一个可视化工具,HTML/CSS/JS 实现,纯前端,把代码下载下来点开 index.html 就能用。发给师姐后,我又想着,只有这一个功能不行哦,反正还有时间,于是我就又开发了一个简单的 alphafold3 模拟结果可视化,后续这两天又加了很多功能,成为了一个生信数据可视化工具箱。全部基于前端实现,无后端,数据全部在本地,GitHub pages 部署,简单又好用,我还找了一个师兄和一个师姐,共同进行开发,也发到生信群里,收到不少反馈意见,后续也继续进行迭代,也算做了一点好事吧,哈哈哈。
后续开发计划如下:
- 为生信工具箱补齐功能,并且接入 ds 和 GTP 的 api,对进化树可视化的功能进行完善,每次做进化树我都头疼,实在有点麻烦
- S3 图床,目前没有找到我满意的,只能说,自己动手丰衣足食,写一个 web 端,然后写一个配置文件,随时用随时导入,再加上一些我需要的功能,CF R2 还没有很好的管理页面,也正好可以一起实现
- 将部分给科伦 web 平台写的后端 Python 代码做成 pip 包,这也是博士要我做的一件事
- 对 scoop 进行优化完善,每次更新应用的时候,如果应用在运行,更新就会被打断,很难受,还有其他一些细节
- 开发一个自己的 scoop bucket,这个想法之前老早就有了,现在的 scoop 没有生物学软件,像 tbtools、mega、blast 等,用 scoop 装的话将会方便很多
关于我
考研期间,大半年没怎么运动,导致体型走样,身体素质变差,到温江开始实习后,晚上有时间都会去跑步,绕着前面的一片园区跑一圈,大约 40 分钟,五六公里的样子,感觉身体素质慢慢走回了正规,不过体重还是没有下来,后面打算狠狠心,调整一下饮食,争取再瘦 10 斤。可能也是习惯了这边的生活,现在感觉每天都有事情要做,也不会经常去想一些有的没的,正如 CS 里 CT 阵营的一句台词所说:“丢掉幻想,准备战斗”。也做了好几次梦,梦到我的考研成绩,时好时坏,现在我也不去想,到时候自有分晓。
关于未来
我其实还没有具体想过,如果考研失利我该如何?我只是想着,可以在科伦先留下来,边工作边二战,但是还没有决定。实际对我而言,只要过了国家线,能调剂到一个差不多的学校,我也愿意读,我不想二战,实在太痛苦了,感觉一战已经耗尽了我的精力,所以不到万不得已,我是绝不会二战的。不过我还是很庆幸,走上了生信+AI 的这条路,这比环境科学与工程好了太多太多,并且我自己也感兴趣,所以我觉得,如果考上了,我再奋斗几年,应该还是能够做出一些事情的。