Cyan's Blog

走向天堂

人不能走到天堂，只能走向天堂。走向，意味着彼岸的成立；走到，岂非彼岸的缺失？所以天堂并非一处空间，一处物质性的存在，而是一条道路，一条精神的恒途。物质性天堂注定难为，而精神的天堂恰于走向中成立，永远的限制是其永远成立的依据。形象地说：“设若你果真到了天堂，然后呢？无所眺望或另有眺望都证明所至之地并非圆满。而你若永远地走向它，你便随时都沐浴在它的光照之下。”

                            
                            【学习】在DeepSeek-R1-1.5b模型上做一个简单的lora微调~
                        
                                最近开始上手微调模型做些小项目，所以先简单写了个lora微调DeepSeek-R1-Distill-Qwen-1.5B的脚本，熟悉熟悉一些基本的库和微调操作。记录一下~
                            
                                2025-02-18
                            
                                    学习
                                
                            学习笔记
                        
                            【学习】手写一个lora微调算法~
                        
                                手写个lora微调算法，熟悉一下手动lora类的实现，以及装载到模型上微调的方法。下一步继续学习一下手写MoeLoRA，以及DeepSpeed和Accelerate框架的使用方法~
                            
                                2025-01-22
                            
                                    学习
                                
                            学习笔记
                        
                            【学习】DeepSeekMoE：我们需要更多Experts！
                        
                                将MOE的专家数进一步分割细化，增设共享专家，预训练模型的工作。话说今年DeepSeek真火哇
                            
                                2025-01-05
                            
                                    学习
                                
                            学习笔记
                        
                            【学习】手搓Transformer：Conbination
                        
                                回想起上次仔细看transformer还是上次，现在遗忘得又有点多了，干脆从原理到代码重新过一遍，于是就有了这篇博客~
                            
                                2024-12-27
                            
                                    学习
                                
                            学习笔记
                        
                            【学习】手搓Transformer：Encoder & Dencoder
                        
                                回想起上次仔细看transformer还是上次，现在遗忘得又有点多了，干脆从原理到代码重新过一遍，于是就有了这篇博客~
                            
                                2024-12-26
                            
                                    学习
                                
                            学习笔记
                        
                            【学习】手搓Transformer：Multi-Attention
                        
                                回想起上次仔细看transformer还是上次，现在遗忘得又有点多了，干脆从原理到代码重新过一遍，于是就有了这篇博客~
                            
                                2024-12-25
                            
                                    学习
                                
                            学习笔记

【手记】小径

【学习】Patch-level Routing in MOE：针对局部图像区域分配专家，提高样本效率

【手记】2024-新春寄语

【学习】“视界感知者”项目开发文档