刘华,上海财经大学统计学博士,上海财经大学和加拿大西蒙弗雷泽大学统计与精算学院联合培养博士,现任西安交通大学经济与金融学院统计系助理教授。主要研究方向为函数型数据分析、面板数据分析、非参数/半参数建模、分位数回归、大数据分析。在《Journal of the American Statistical Association》(JASA)、《Statistica Sinica》等国际知名期刊上发表多篇优秀学术成果。
近日,博文经济学社有幸采访了刘华老师。通过交谈,让我们进一步认识了刘老师的学术科研之路,下面予以分享,希望对大家有所启发。
作为上海财经大学的优秀博士生,在漫漫求学路上,刘老师深有感触到,“我的求学经历是从不主动到主动探索、研究的一个过程,对统计学也是由之前的一知半解到后来通过专业课的学习发现了自己的兴趣所在。在刚要读研的时候,面对全新难度的知识体系,我一开始有些手足无措,好在导师安排的讨论班给了我不断吸收、深化知识的机会,在此之后我便开始主动去探索自己的兴趣点,研读相关书籍,与师门广泛交流,主动展示阅读文献过程中的收获,这种改变让我收获很多。2017年硕转博的暑假,我参加了一名来自加拿大教师的讲座,之后,我感觉到了自己对函数型数据研究的浓厚兴趣,并开始主动争取参与该教师的合作项目,最终获得了前往加拿大留学的机会。”
在多年的学术研究中,刘老师曾参与了《复杂数据/函数型数据的建模及一致稳健性和有效统计推断》等国家自然科学基金项目,并就函数型数据研究发表过多篇高水平论文。关于函数型数据,她介绍到,函数型数据的应用范围比较广,在经济学上包括生物统计、气候等方面都有应用。面板数据其实是函数型数据的一种,面板数据模型一般会对时间维度上的相关性有一些假定,但是函数型数据不再需要这些假设,函数型数据是无穷维的。对于无穷维的一个数据,首先就是要找一个降维的方法。对于函数型数据来说,则需要考虑光滑性等方面,控制起来会更复杂,有时候还需要满足单调性。同时,在函数型数据当中有一个很重要的工具—FPCA,即函数型主成分分析,它可以对数据进行提取,分析数据内部的变化。例如把家庭用电量当成一个函数型数据,那一个家庭就有一条用电量的曲线,函数型数据就可以把它降维,然后提取出主成分,它既可以提取出一个家庭的基本用电,也可以提取出为了适应不同季节引起的用电的变化,它可以用来分析每个家庭不同的行为。另外,函数一般都会有给一个定义域,可以是时间,也可以是一个不规则的形状,它不仅可以随着时间变化,随空间变化也是可以的,比如函数型数据这几年经常应用于阿尔兹海默症的研究上。
刘老师的研究还涉及到大数据分析,她认为,大数据有三个主要的特点,第一个就是它的数据类型会更复杂一点,第二个就是它数据量级会比较大,第三个就是它的更新速度会很快。大数据分析主要是收集数据和存储数据,之后进行一些清洗处理,最后一步就是根据具体想要分析的问题,采取具体的分析方法。大数据分析既可以对全部数据进行分析,也可以选取代表性数据进行抽样分析。但由于数据隐私等问题,数据提供方往往不会提供最终结果,而仅提供中间数据,这就需要进行分布式计算对中间结果进行汇总分析。
作为统计学领域的新星,面对同学们在统计实证等方面的困惑,刘老师指出自己不是很赞同模型构建的越复杂就越高级这种观点,纵观统计学或者计量的发展,那些影响力非常大的文章很少提出非常复杂的模型,重点在于根据想要研究的问题去寻找适合的统计方法,以及实证分析出来的结果,而不是方法的复杂与否,例如对待截面数据非要用函数型数据的方法去做是没有必要的。
最后,就如何提升自己的学术能力,刘老师建议同学们可以在B站或者其他网站上多看一些实证统计方面的基础课或公开课,比如复旦、清华的公开课。除课程外,网络上也有很多相关的专业比赛,比如kaggle,在比赛实践中不断深化学习也是一种好的锻炼方法。除了在网上学习一些公开课以外,多读文献也是提升自身学术能力的方法之一。在文章选择上,刘老师建议要多读权威杂志的文章,学术品位很重要,这有助于培养同学们对高质量论文的认知和写作思维模式。此外,还要学会以文献为基础讲故事,围绕数据分析的结果去说话,通过查阅当时的新闻资料等来研究其形成的原因,然后从头梳理文章,理清行文逻辑。“除了加强自身的学习外,科研最重要的还是多沟通,多跟自己的导师沟通,多听学术大牛的讲座,去学习新的观点和思路,寻找自己感兴趣的领域。合作对于科研也是很重要的,闭门造车肯定是不行的。总之,最怕的就是不知道做什么,也不付出行动,最重要的还是同学们要明确自己目标,一旦确定了目标,知道自己想要什么,那就放开手脚大胆去做”。
经金学院
2022年7月5日