|
2023年主要整了这些活:
AI诗歌相关:
AI同光体会梦到赛博杜甫吗?——AI旧体诗创作漫谈&整活倡议
击壤诗录卷一
击壤诗录卷二
击壤诗录卷三
击壤诗录卷四
他时须虑石能言——浅谈人工智能诗歌发展及其影响
实用工具:
自动化古籍排版——以黄节《蒹葭楼诗》为例
赛博驺虞助手——集句辅助程序
书评:
一本快乐的书——《陈衍诗歌选评注》
钱载,平教授,人工智能
《近代诗钞》纠错&吐槽(上册)(因为我转去读钱仲联版的近代诗钞,所以后续烂尾)
不知道该怎么分类:
争议与回应|关于《陈衍诗歌选注评》(突然发现这篇回应的书名写错了,实在是对不起周教授)
2024年整活计划:
自动集句
之前发布的赛博驺虞助手,是一个辅助集句的工具,使用者需要输入平仄和用韵要求,再从返回的句子中自行选择。自动集句的程序我其实已经开发出来了,但目前效果还不算好,且速度慢到不能用,过段时间优化后会放出来。 对仗
为了解决集句时的对仗问题,我开发了一个判断句子是否对仗的程序,本来只是打算作为自动集句程序中的一小部分,但意外发现把这个程序当做一个研究工具更有意义,可以帮助阐明先唐诗人的文学自觉意识与唐以后诗人的文体自觉意识。过段时间会发一些有趣且solid的结论。 浣花DLC 击壤现在有两个DLC,一个是同光,一个是艳体(说艳其实也不艳,只是清丽),钱仲联曾有浣花诗坛点将录,把他认为学杜且成就高的后世诗人排了三十六个出来。如果把这些人的诗交给AI学习,大概能生成和杜甫风格相近的作品。
机注 陈衍事件之后,我和搜韵的陈逸云兄谈到了一个想法——测试一下搜韵注书的水平。我有个朋友玛老师形容某书注得烂,动辄言“搜韵注书之典范”,她其实没有意识到,相当一部分注本完全达不到搜韵注书的水平,夸这些书是用搜韵注的不啻为一种褒奖。 那么搜韵注书具体是一个什么水平呢?我打算试试,尽量模拟一个对诗词仅有基础认知的读者(看过古诗源,唐三百,宋三百那种),利用搜韵的自动笺注、相似句子等功能去注一本清人别集。为避免个人因素的影响,搜韵查不到的,哪怕我知道也不注,看看最后是什么效果。
词向量 目前古代汉语领域似乎没有词向量,只有以字为单位的字向量,这就带来了一些问题。以字为单位的情况下,“鹤”和“鸟”的相似自然可以被检测出来,但是“鹤”和“[url=]丁令威[/url]”的相似怎么算呢?因此,整一个适用于古诗文的词向量是有一定意义的。之前我已经做了一些相关的工作,初步构建的词向量可以体现出“鹤-丁令威”“五柳-彭泽”等词的相似性,等结果优化后打算配上例子发出来。 ChatGPT微调 ChatGPT没有对诗词领域进行过专业训练,效果比较一般,可能也就唬唬外行。那么如果把上百万首诗词输入到ChatGPT里进行训练,得到的微调模型效果怎么样呢?
诗句相似度 之前清华的九歌团队公开了一个诗句相似度计算的程序,原理大概是先用[url=]bert模型[/url]算出每字的字向量后进行平均池化形成一个句向量。这个方案很成熟,但使用效果不是很能达到预期,我计划研究一下有没有更好的方法。 乾隆诗词臣代笔情况研究
川大有朋友在陈逸云兄的建议下,follow我的诗风判定论文完整版,研究乾隆四万多首诗中哪些是词臣代笔,并写了篇文章。之后可能会在征得她同意后放一些结论。
公安派、竟陵派、性灵派
可以用现有的工具探究一下三者的关系,暂时还没头绪,先挂这。
仿古籍排版PDF 之前发过从TXT到仿古籍排版的程序,这个项目已经可以落地了,找时间我会发一些已经排好的PDF,有意者可自印。 乾嘉诗风判别
乾嘉诗坛相信大家都很熟悉了,性灵派,格调派,肌理派,高密诗派,这些诗派都有自己的宗尚。在这种多派并存的情况下,一个乾嘉诗人到底受哪个流派影响大一点呢?某些代表人物自不必多言,像袁枚,沈德潜,这两人无疑是性灵派和格调派的。但是还有一些诗人同时受到数个派别的影响,比如[url=]吴镇[/url],他早年持论与格调派无异,后来又转向性灵派,论诗时对[url=]明七子[/url]和公安派都有所肯定。这种“不站队”的诗人应该为数不少,我们可以用现有的工具去推测他们都受了哪些派别的影响,以及这些派别对他们的影响有多大。
写到这里我已经黔驴技穷了,大家有什么建议也可以发消息告诉我。唉,活渐凡庸人可想,希望新的一年我可以像驺虞一样有活。
|