2010-4-14 08:42
numdisp
LS11数据格式分析总结和完整解压缩代码
[size=3][b]最后更新 2010-04-16,文档版本 0.2[/b][/size]
虽然前面已经有几大高手讨论过了,但是系统、完整一点的文献好像还没看到。直接可用的、完整的源代码也不多。这里在前人的基础上写了一些关于LS11的详细内容,并给出了完整的可执行程序和源代码,希望能对需要的人有所帮助。
由于排版方面的原因,直接贴到论坛上不是很方便,于是将详细的正文附在了附件的PDF文档中,需要的可以直接打开浏览。由于在下写作水平低陋,而且对van和Maxwell等人的原帖理解有限,所以烦请各位在检阅之余,还帮忙找找文中的谬误,我及时修正,以免误导。
附件还包括一个简陋的解压缩程序,并附上了完整的C语言源代码。相信有编程能力的人很容易将其改成更强大的程序。源代码中的解码函数参考了Maxwell的部分算法,未得到Maxwell的允许便写进了程序,希望Maxwell海涵。
如果您发现本文中的文字或者程序冒犯了您的版权,请通知我,我立刻修改或者删除。
[size=3]附正文摘要:
LS11格式的数据文件存在于KOEI®开发的许多经典游戏中,比如大航海时代系列和三国志系列等等。本文在前人的基础上对LS11的详细格式进行了探讨,总结并阐述了LS11文件的具体格式,数据压缩方法,还原算法等等。并给出了完整的解压缩程序和源代码。[/size]
[b]详情还是请见附件吧![/b]
[color=Silver][[i] 本帖最后由 numdisp 于 2010-4-17 12:10 编辑 [/i]][/color]
2010-4-14 08:45
numdisp
0.2版的文档加上了致谢.
--
原文中忘了加上致谢,这里补上:
除了感谢van、maxwell、和gameplore等人精辟的讨论之外,还要特别感谢阿尔法孝直验证我的解压程序。
谢谢。
[color=Silver][[i] 本帖最后由 numdisp 于 2010-4-20 02:24 编辑 [/i]][/color]
2010-4-14 12:55
dhlgdmh
谢谢分享
2010-4-14 22:59
han6
文档写得相当专业啊。会写解压缩程序的不少,但能写出这么漂亮清晰的文档的,恐怕不多。
2010-4-14 23:03
阿尔法孝直
回复 #4 han6 的帖子
是的,这样的文章在轩辕太少了。
另外,楼上是谁我就不说了。。。。。。。。。。
2010-4-14 23:16
numdisp
刚又随便检查了一下,发现了不少笔误,这里纠正一下。原帖中的文件已替换为修定后的版本。
第5页的表格,索引项最后一项值应为[color=Red]255[/color],而不是256。
第6页,第6行,“继续读取8个数”,应为“继续读取[color=Red]第[/color]8个数”,接着的“为1”应为“为[color=Red]2[/color]”,后面的公式中也应为 nc = [color=Red]2[/color] + C
第6页,第四小节倒数第二段:“从上面的复制过程可以看出,....”一句中,“当然”一词应为“当[color=Red]前[/color]”。
还是第6页,第四小节最后描述复制过程的段落,“复制完成后,继续读取下一个数,为[color=Red]2[/color]”一行应该删除([color=Blue]这个错误太大了[/color]!)。
第7页,最后一行,Endian[color=Red]n[/color]ess一词少拼了一个n
第8页程序授权许可增加了一句话。
2010-04-16更新:
把原文中的“掩码”和“因子”的概念互换了。
致谢部分写入了正文。
修正了许多错别字。
增加了页码。
文档版本更新为0.2
再发现谬误会继续在本帖补上。
[color=Silver][[i] 本帖最后由 numdisp 于 2010-4-17 12:12 编辑 [/i]][/color]
2010-4-15 06:48
numdisp
发现了一些问题
哪位能正确地解压缩附件中的这个LS11文件?
我的程序中有一段代码是判断文件是否合符预想中的LS11规范的,其中一条判断准则就是:
假设待解压的文件总长度为 TLEN,文件中含有 N 段压缩数据, 每段压缩数据的长度分别为 L(i), (i = 1 ~ N)。 那么,按照文中的分析,上述几个变量应满足以下等式:
16 + 256 + N*12 + 4 + SUM( L(i) ) = TLEN (其中SUM 代表求和)
我试验了大部分LS11文件,的确满足上述关系。可是附件中的这个文件却是个例外。这个文件的体积远超出了预定的大小,不满足上述关系式。这个文件是我从PC版的大航海时代2这个游戏中摘出来的,应该是合法的LS11文件。
初步猜测以前描述的LS11文件格式并不完全,应该还有些尚未挖掘出来的信息。请高手帮忙看看。
2010-4-15 07:40
阿尔法孝直
看了一下Van的RPGViewer,貌似还不支持大航海2,看来Van自己也没解决这个问题。
另外,我用我自己的解压程序解了这个文件,发现解压后的文件大小和解压前的完全一样:hz1031:
[color=Silver][[i] 本帖最后由 阿尔法孝直 于 2010-4-15 07:46 编辑 [/i]][/color]
2010-4-15 09:39
numdisp
回复 #8 阿尔法孝直 的帖子
其实我就是为了大航海2才干这个事的,van的RPGViewer要是支持大航海2我就不会自己研究LS11了。
2010-4-20 01:13
比古清十郎
van的RPGViewer只支持导出王国兴亡录的图片,导回去会出错。LZ能不能做个把解压的文件重新压缩的程序啊,拜托了。
2010-4-20 02:23
numdisp
俺水平有限,压缩代码现在暂时还没整出来。:hz1011:
Maxwell的帖子里似乎有(gameplore的程序),不过我没用过。
2010-4-20 07:09
比古清十郎
我试过gameplore的程序,好像会出错啊。只好期待numdisp 大人啥时候出个压缩的程序了。:hz1020:
2010-4-23 13:18
numdisp
回复 #12 比古清十郎 的帖子
理论上讲,压缩要做的事情要比解压缩多。这段时间太忙,暂时没时间弄了。等有空再说吧。
不过,如果看懂了上面的文档,再结合Maxwell, gameplore等人的讨论仔细研究一下应该也是比较容易实现相应的压缩程序的。
2010-4-23 14:29
比古清十郎
要是看的懂,我早自己动手了。看那东西和看天书没两样,我只能期待各位编程高人了。
2010-4-24 14:07
GOODCHAOGEGOOD
[quote]原帖由 [i]numdisp[/i] 于 2010-4-15 06:48 发表
哪位能正确地解压缩附件中的这个LS11文件?
我的程序中有一段代码是判断文件是否合符预想中的LS11规范的,其中一条判断准则就是:
假设待解压的文件总长度为 TLEN,文件中含有 N 段压缩数据, 每段压缩数 ... [/quote]
可以解压,也可以再压缩回去,尽管文件大小与原来不同,但是应该不影响使用,解压压缩三国志6的MSG文件的时候也是如此,压缩后的MSG文件大小与原来的不同,但是游戏可以正常读取。
2010-4-25 11:42
Maxwell
压缩我怎么觉得我写过,貌似叶落秋寒还说我的代码压缩后与原来文件不一样。
2010-4-25 12:15
Maxwell
楼主是*nix派?
2010-4-25 12:38
numdisp
回复 #15 GOODCHAOGEGOOD 的帖子
我的程序中,如果去掉根据文件大小来判断合法性的准则的话,也是可以解开的,就是不知道后面多出来的信息是什么。
这个其实也不难,上面贴的KAO.LZW里面应该都是一些图片。解开后研究一下存储方式就知道了。
不过这段时间实在是无暇顾及了,好多事情,再不交成果,老板就....:hz1049:
另外,既然大侠有解压和压缩一体的程序,何不发上来让前面那位仁兄了却一桩心愿?
2010-4-25 12:42
numdisp
Maxwell版大也出来了,你说的解压程序我没找着啊,可否贴一个链接?不过上面的GOODCHAOGEGOOD的程序看起来也很强啊。
另外,何以见得俺是 “*nix派”?就凭源码里多了个emacs的模式注释?
悄悄的说,其实我是两面派,:hz1057:
2010-4-25 12:44
比古清十郎
GOODCHAOGEGOOD的程序可以用在王国上哦,谢谢各位老大。:hz1020:
2010-4-25 12:46
numdisp
回复 #20 比古清十郎 的帖子
请问程序链接在哪儿?麻烦贴一个让我也收藏一下。
2010-4-25 12:48
比古清十郎
回复 #21 numdisp 的帖子
LS11压缩解压工具 ,就是本帖下面一个啊。
[url]http://www.xycq.net/forum/thread-208491-1-1.html[/url]
[color=Silver][[i] 本帖最后由 比古清十郎 于 2010-4-25 12:49 编辑 [/i]][/color]
2010-4-25 12:51
numdisp
回复 #22 比古清十郎 的帖子
我土星了,居然没看新帖~~,上面对GOODCHAOGEGOOD说的全部作废。话说有源码么?(我太无耻了。)
[color=Silver][[i] 本帖最后由 numdisp 于 2010-4-25 12:53 编辑 [/i]][/color]
2010-4-25 12:55
比古清十郎
:hz1020:太开心了,终于可以改了,哇哈哈。
刚发现,我几年发的帖子也没这几天发的多的。:hz1026:
2010-4-25 12:56
Maxwell
[quote]原帖由 [i]numdisp[/i] 于 2010-4-25 12:42 发表
Maxwell版大也出来了,你说的解压程序我没找着啊,可否贴一个链接?不过上面的GOODCHAOGEGOOD的程序看起来也很强啊。
另外,何以见得俺是 “*nix派”?就凭源码里多了个emacs的模式注释?
悄悄的说,其实我是 ... [/quote]
:hz1016:从你的文件换行符、代码风格、注释都看着像*nix派。emacs我主要用ntemacs,linux下用vi,不过linux下基本不写代码。
上面说的程序大概是这个:
[url]http://www.xycq.net/forum/thread-208491-1-1.html[/url]
我的压缩程序是否存在我也存疑:hz1025:,看到我发的帖子里Encode函数是空的。以前写的东西都在另一台老电脑里了,只是觉得我跟叶落秋寒等人讨论过相关问题,而且都讨论到如何压缩能跟原来文件一致还有效率问题了,想必是写过代码的。另外关于压缩我好像写过帖子。
2010-4-25 13:07
numdisp
回复 #25 Maxwell 的帖子
让版大见笑了,其实俺是纯业余的:hz1026:不过平常工作经常需要Windows/Linux两边倒腾,所以代码干脆全部*nix换行风格了,免得老是要dos2unix的转换。我写C的程序全是*nix风格,不过如果是GUI,又是C++的话,就全是MS风格了。文档的话,虽然看起来煞有其事,其实一读就知道写的很烂了。
另外,除了这段时间出现的LS11相关贴外,前面的似乎就只有我文档里提到的两个帖子了,而且年代比较久远了。压缩方面,前面的帖子的确是有讨论过,就是你和gameplore等人一起讨论了很多的那个超长贴,精华区的文献我也看了,想必实现不会很难,只是目前业余时间实在有限,没办法仔细研究了。等日后有空了再继续吧。不过GOODCHAOGEGOOD发的那个程序如果有源码的话就太好了。
[color=Silver][[i] 本帖最后由 numdisp 于 2010-4-25 13:08 编辑 [/i]][/color]
2010-4-25 13:34
Maxwell
[quote]原帖由 [i]numdisp[/i] 于 2010-4-25 13:07 发表
让版大见笑了,其实俺是纯业余的:hz1026:不过平常工作经常需要Windows/Linux两边倒腾,所以代码干脆全部*nix换行风格了,免得老是要dos2unix的转换。我写C的程序全是*nix风格,不过如果是GUI,又是C++的话,就全 ... [/quote]
我找了一下,以前我写过这么一篇帖子
[url]http://www.xycq.net/forum/viewthread.php?tid=64471[/url]
从帖子看,我应该是写过完整代码的。:hz1010:
你自称是业余的,可是看你代码的水平比很多从事编码工作的人的水平要高很多,实在是太谦虚了。如果编程不是你的专业的话,那么你是做信号处理的?我只知道这一个专业需要编程还要linux/windows两边倒。:hz1026:
我是工作中用ms风格,自己写代码还是喜欢标准c++的风格,不过就算写c代码也不用k&r的括号风格。:hz1016:
2010-4-25 13:56
numdisp
回复 #27 Maxwell 的帖子
你贴的这个链接就是我前面说的“精华区中的帖子”。由于我研究LS11的目的只在解压部分,所以对这个帖子以前只是粗略的看过,没有仔细消化。不过你的帖子里的代码已经很详细了,我想稍微花点功夫实现完整的压缩程序应该很简单了。
算啦,再这样回帖的话有版聊的嫌疑了,闪人吧。改日再会。
2010-10-16 22:16
loujiawei
求助
传承文明社区的续英杰传用的是ls13格式,我发现该格式存在一种情况就是读到大于256的值往回退的时候不够退,这该怎么办呢?比如说序列值为 1、2、3、260,260即退4个字节,就退到1前面去了,晕死>.<
用RV读取续英杰传的资源文件同样非法操作
2010-10-18 23:15
northwind_x
以前用C#写过LZW的压缩解压算法,现在多半都忘记了
PS : 楼主的文档写的真是专业!!!!
页:
[1]
Powered by Discuz! Archiver 5.0.0
© 2001-2006 Comsenz Inc.