中华诗词论坛

 找回密码
 立即注册
查看: 1199|回复: 8

[基础知识] AI《击壤》研制者刚刚发布的今年总结和明年计划

[复制链接]
发表于 2023-12-15 18:30:06 | 显示全部楼层 |阅读模式
2023年主要整了这些活:
AI诗歌相关:
AI同光体会梦到赛博杜甫吗?——AI旧体诗创作漫谈&整活倡议
击壤诗录卷一
击壤诗录卷二
击壤诗录卷三
击壤诗录卷四
他时须虑石能言——浅谈人工智能诗歌发展及其影响
实用工具:
自动化古籍排版——以黄节《蒹葭楼诗》为例
赛博驺虞助手——集句辅助程序
书评:
一本快乐的书——《陈衍诗歌选评注》
钱载,平教授,人工智能
《近代诗钞》纠错&吐槽(上册)(因为我转去读钱仲联版的近代诗钞,所以后续烂尾)
不知道该怎么分类:
争议与回应|关于《陈衍诗歌选注评》(突然发现这篇回应的书名写错了,实在是对不起周教授)

2024年整活计划:
自动集句
之前发布的赛博驺虞助手,是一个辅助集句的工具,使用者需要输入平仄和用韵要求,再从返回的句子中自行选择。自动集句的程序我其实已经开发出来了,但目前效果还不算好,且速度慢到不能用,过段时间优化后会放出来。
对仗
为了解决集句时的对仗问题,我开发了一个判断句子是否对仗的程序,本来只是打算作为自动集句程序中的一小部分,但意外发现把这个程序当做一个研究工具更有意义,可以帮助阐明先唐诗人的文学自觉意识与唐以后诗人的文体自觉意识。过段时间会发一些有趣且solid的结论。
浣花DLC
击壤现在有两个DLC,一个是同光,一个是艳体(说艳其实也不艳,只是清丽),钱仲联曾有浣花诗坛点将录,把他认为学杜且成就高的后世诗人排了三十六个出来。如果把这些人的诗交给AI学习,大概能生成和杜甫风格相近的作品。
机注
陈衍事件之后,我和搜韵的陈逸云兄谈到了一个想法——测试一下搜韵注书的水平。我有个朋友玛老师形容某书注得烂,动辄言“搜韵注书之典范”,她其实没有意识到,相当一部分注本完全达不到搜韵注书的水平,夸这些书是用搜韵注的不啻为一种褒奖。
那么搜韵注书具体是一个什么水平呢?我打算试试,尽量模拟一个对诗词仅有基础认知的读者(看过古诗源,唐三百,宋三百那种),利用搜韵的自动笺注、相似句子等功能去注一本清人别集。为避免个人因素的影响,搜韵查不到的,哪怕我知道也不注,看看最后是什么效果。
词向量
目前古代汉语领域似乎没有词向量,只有以字为单位的字向量,这就带来了一些问题。以字为单位的情况下,“鹤”和“鸟”的相似自然可以被检测出来,但是“鹤”和“[url=]丁令威[/url]”的相似怎么算呢?因此,整一个适用于古诗文的词向量是有一定意义的。之前我已经做了一些相关的工作,初步构建的词向量可以体现出“鹤-丁令威”“五柳-彭泽”等词的相似性,等结果优化后打算配上例子发出来。
ChatGPT微调
ChatGPT没有对诗词领域进行过专业训练,效果比较一般,可能也就唬唬外行。那么如果把上百万首诗词输入到ChatGPT里进行训练,得到的微调模型效果怎么样呢?
诗句相似度
之前清华的九歌团队公开了一个诗句相似度计算的程序,原理大概是先用[url=]bert模型[/url]算出每字的字向量后进行平均池化形成一个句向量。这个方案很成熟,但使用效果不是很能达到预期,我计划研究一下有没有更好的方法。
乾隆诗词臣代笔情况研究
川大有朋友在陈逸云兄的建议下,follow我的诗风判定论文完整版,研究乾隆四万多首诗中哪些是词臣代笔,并写了篇文章。之后可能会在征得她同意后放一些结论。
公安派、竟陵派、性灵派
可以用现有的工具探究一下三者的关系,暂时还没头绪,先挂这。
仿古籍排版PDF
之前发过从TXT到仿古籍排版的程序,这个项目已经可以落地了,找时间我会发一些已经排好的PDF,有意者可自印。
乾嘉诗风判别
乾嘉诗坛相信大家都很熟悉了,性灵派,格调派,肌理派,高密诗派,这些诗派都有自己的宗尚。在这种多派并存的情况下,一个乾嘉诗人到底受哪个流派影响大一点呢?某些代表人物自不必多言,像袁枚,沈德潜,这两人无疑是性灵派和格调派的。但是还有一些诗人同时受到数个派别的影响,比如[url=]吴镇[/url],他早年持论与格调派无异,后来又转向性灵派,论诗时对[url=]明七子[/url]和公安派都有所肯定。这种“不站队”的诗人应该为数不少,我们可以用现有的工具去推测他们都受了哪些派别的影响,以及这些派别对他们的影响有多大。


写到这里我已经黔驴技穷了,大家有什么建议也可以发消息告诉我。唉,活渐凡庸人可想,希望新的一年我可以像驺虞一样有活。



发表于 2023-12-16 06:35:49 | 显示全部楼层
AI《击壤》是和《搜韵》一样的网站吗?

点评

我是在微信上看到的一个公众号。百度可以找到一个登录版面,但是没有注册功能,我不会用  详情 回复 发表于 2023-12-19 00:10
发表于 2023-12-16 07:58:49 | 显示全部楼层
哈哈,哎呀。时代啊。会不会是人类的悲哀???

点评

它到底能做到什么程度还很难说  详情 回复 发表于 2023-12-19 00:12
发表于 2023-12-16 09:01:26 | 显示全部楼层

     如果是发给”人类“的宣战书,怕是无人敢应战。

点评

总之,这事情值得关心。不过对于人类作者来说,我抒我的情,AI是无法取代的。  详情 回复 发表于 2023-12-19 00:14
发表于 2023-12-16 13:34:15 | 显示全部楼层
电脑不能替代人脑。

马斯克在搞电脑、人脑对接,更是不容易。人 触景生情,电脑里的是输入的,再组合不会出大家。

点评

这点有道理,我们慢慢看发展。  详情 回复 发表于 2023-12-19 00:14
 楼主| 发表于 2023-12-19 00:10:48 | 显示全部楼层
温馨家园 发表于 2023-12-16 06:35
AI《击壤》是和《搜韵》一样的网站吗?

我是在微信上看到的一个公众号。百度可以找到一个登录版面,但是没有注册功能,我不会用
 楼主| 发表于 2023-12-19 00:12:38 | 显示全部楼层
成都苏刚 发表于 2023-12-16 07:58
哈哈,哎呀。时代啊。会不会是人类的悲哀???

它到底能做到什么程度还很难说
 楼主| 发表于 2023-12-19 00:14:07 | 显示全部楼层
笑品诗词 发表于 2023-12-16 09:01
如果是发给”人类“的宣战书,怕是无人敢应战。

总之,这事情值得关心。不过对于人类作者来说,我抒我的情,AI是无法取代的。
 楼主| 发表于 2023-12-19 00:14:52 | 显示全部楼层
虹吟秀野 发表于 2023-12-16 13:34
电脑不能替代人脑。

马斯克在搞电脑、人脑对接,更是不容易。人 触景生情,电脑里的是输入的,再组合不 ...

这点有道理,我们慢慢看发展。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|中华诗词论坛

GMT+8, 2026-3-31 03:59

备案号:辽ICP备2022011476号  辽公网安备21130202000468号

Powered by Discuz! X3.4 Licensed

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表