2024/08/10 (10.4h)
- ‼edit my blog and organize files (10.4h)
- #char_type:335069
- edit blog in autodaily, add TODOLIST/WISHLIST in hexo, edit via obsidian.
- Write my thesis paper via mdbook;
- Maybe I should use mdbook instead of beamer for presentation, not hexo for documentation, maybe. #mdbook #hexo #todo #obsidian #blog
- Using todo list and hexo-blog via obsidian for daily work, using mdbook for presentation.
2024/08/10 (5.8h)
- #char_type: 367368
- QiXi Festeval so that I did not much work today.
- Well, it’s weekend, just finish my workflow building tomorrow.
2024/08/12 (10.7h)
#char_type : 403606; was wrong, I should align codon, not just nuc. maybe all align should be rerun, but i just need choose only one. it is not a big thing now.
2024/08/13 (8.6h)
#char_type : 434840;
2024/08/14 (8.1h)
#char_type : 456049 ;
- mafft-xinsi for rrna and mafft-linsi for cds? #alignment
2024/08/15 (9.9h)
- align mito_2012/2019 cds #fit_data (10.0h)
#char_type : 486401;
- whole mito data cannot be split into genes simply. maybe I just need to test the whole align and the partial gene data. It’s not important so it will be ok.
- maybe I need to cut some column via seqkit or seqconverter because of gaps and maybe I can get better dataset.
2024/08/15 (8.7h)
#char_type : 522966;
- list models, check every datasets. I need a table.
- Beside revbayes, I need some other tests, maybe.
- I need test the best model they used or best model under model-finder, not just GTR.
- Covarian and GHOST, how to test?
- maybe I should learn about how to enter model file into revbayes first, then think about my model.
2024/08/17 (11.0h)
#char_type : 541852
2024/08/18 (8.2h)
#char_type : 570013
2024/08/19 (5.6h)
#char_type: 593248;
2024/08/20 (7.6h)
#char_type : 614842
- 今天发现之前的p-value计算脚本出错了,sim和emp的比较错了一位,已经改正
- 理解了R做图的脚本,发现没啥用,不如直接用pvalue脚本
- 理解了pvalue脚本的输出,其中low和upper就是emp值在pp分布中的上和下的概率,但是这都包括了恰好等于的部分,所以mid是把恰好等于取一半的修正,然后效应量是计算“模拟行为多大程度改变了样本总体”,效应量越小越好,太大不好。
2024/08/30 (24.5h)
#char_type : 666424
2024/08/31 (10.2h)
#char_type : 696500
2024/09/04 (18.2h)
#char_type : 769353
2024/09/05 (3.0h)
#char_type : 826647
2024/09/08 (23.8h)
#char_type : 879369
2024/09/10 (13.7h)
#char_type : 907274
2024/09/11 (0.0h)
#char_type : 929101
2024/09/17 (0.0h)
#char_type : 968136
2024/09/19 (0.0h)
#char_type : 983605
2024/09/22 (0.0h)
#char_type : 992598
2024/09/24 (0.0h)
#char_type : 1020221
2024/09/27 (0.0h)
#char_type : 1037327
2024/09/29 (0.0h)
#char_type : 1043569
2024/10/07 (0.0h)
#char_type : 1059768
2024/10/14 (4.4h)
#char_type : 1104641
2024/10/16 (1.7h)
#char_type : 1115319
2024/10/31 (12.6h)
#char_type : 1381138
2024/11/06 (0.0h)
#char_type : 1540811
2024/12/01 (0.0h)
#char_type : 1879514
2024/12/13 (0.0h)
#char_type : 2015115
2024/12/15 (0.0h)
#char_type : 2063913
2024/12/16 (0.0h)
#char_type : 2085460
2024/12/18 (0.0h)
#char_type : 2115970
此处iqtree主要是阅读文献PhyloForge,关于“SV Signal-Based Population Phylogeny”部分的复现。主要评价如下:
我翻了一下文中的代码,这里所说的sv系统发育,实际上是用indel的01矩阵跑iqtree和model finder…是以前处理形态矩阵时比较基本的一个处理,然而iqtree做树重建时没有考虑zipfian分布之类的indel模型,也不会因为二态矩阵而做相关处理,或许此处的创新可能在于对矩阵的编码方案与之前有所不同…然而依我拙见,sv在系统发育基因组的应用局限并不在重编码10矩阵上,否则可以通过“令xx为0,xx为1”的方式将任何事物变成“系统发育信号”…从这个角度上来讲,这篇文章提供的方案并不算是“基于sv的系统发育重建”,至少文中没有可见的论证…indel数据被应用到系统发育研究中已有很多解决方案,但似乎一直因有效性而难以推广,因而在基因组级别上并不常见,按此文说法或许这篇文章是第一次。数据扩大到基因组级后,有效性问题被数据淹没,增加采样频率确实可以降低信噪比,但考虑到相比系统发育研究的问题,样本总是寡而有偏的,这种信号的提高所带来的帮助是有局限和瓶颈的…况且,相比过采样,增加信号强度和更好的滤镜似乎对最终结果的影响是更大的。总之,注意到近年来系统发育基因组领域对sv数据的热情关注,我想良好的重建方法会在不久的将来出现。
2024/12/26 (0.0h)
#char_type : 2207749
今天仔细看了Tame先验和四足动物线粒体2024sb两篇文章的代码,以及revbayes的教程和源码文件,确认了先验、参数和moves的设置。使用gtr进行了标准化,其中branch lenth部分有比较大的更改,一些moves也有调整,应该重跑一些看看效果。
除此之外,branch rate可以在之后的time calibrating中设置,这是分区/全局的速率参数,用来计算绝对枝长的。目前我的分析应该用不到,但是以后其他研究中,不需要考虑是否必须在一次mcmc中全部采样的问题,branch lenth可以同时,也可以之后进行计算。
2025/01/02 (0.0h)
#char_type : 2321482
#ai_shell: 最近加入了收敛性检查的代码,给罗老师写了邮件,并得到了回复,等待交流。元旦休假,工作暂停了。