找回密码
 立即注册
搜索
查看: 380|回复: 1

[基础语法] 汉文藏经搜集制作思路

[复制链接]

581

主题

110

回帖

4066

积分

管理员

积分
4066

众神之神

发表于 2024-10-19 09:14:00 | 显示全部楼层 |阅读模式
最近研究佛学的藏经,发现几个问题
1、藏经数量多,高达14000余部,有5亿汉字之多,比较难统一搜集;
2、藏经大都是用繁体字撰写,阅读难度高;
3、藏经是用古文言文编写,理解难度高;

为了解决这些问题,我整理了一点思路:
1、整理并搜集汉文大藏经;
2、可以支持汉、繁字体切换阅读;
3、利用AI技术将经书翻译成白话文;

目前能想到的一些技术细节:
1、采集(搜集整理工作)
2、经书内容处理——汉/繁转换
3、经书翻译处理——不能是整篇经书翻译,为了方便阅读,需要拆分成段落后,然后做个段落翻译;

581

主题

110

回帖

4066

积分

管理员

积分
4066

众神之神

 楼主| 发表于 2024-10-19 09:16:26 | 显示全部楼层
一些技术问题:
GPT的训练和使用,使用chatgpt还是国内gpt的大模型,还是基于某个大模型去做的问题;

关于向量的问题:php向量是什么? 分段向量? 向量函数? 向量数据库?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|十三博客 ( 鲁ICP备2023000528号 )

GMT+8, 2026-6-1 15:01 , Processed in 0.049291 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表