about summary refs log tree commit diff
path: root/localedata/th_TH.UTF-8.in
diff options
context:
space:
mode:
authorMike FABIAN <mfabian@redhat.com>2023-06-01 17:02:44 +0200
committerMike FABIAN <mfabian@redhat.com>2023-09-21 10:34:35 +0200
commitaceda10bd5131cf716830827d66da9c671dec649 (patch)
tree85fce5090f9abd310d3a9e0f0e9748d729f98ac8 /localedata/th_TH.UTF-8.in
parent672b91ba1060887aa8897d0b98af83b96d4a52b0 (diff)
downloadglibc-aceda10bd5131cf716830827d66da9c671dec649.tar.gz
glibc-aceda10bd5131cf716830827d66da9c671dec649.tar.xz
glibc-aceda10bd5131cf716830827d66da9c671dec649.zip
Adapt collation in th_TH locale to use the iso14651_t1_common file and sync the collation with CLDR
I made it to agree as much as possible with the rules from CLDR (see:
https://github.com/unicode-org/cldr/blob/main/common/collation/th.xml).

It seems to be impossible to follow the CLDR rules

  &[before 1]๚<ฯ # should be "variable"

and

  &๛<ๆ # should be "variable"

exactly though. These ask for a primary difference in punctuation
characters whose primary weight should be "IGNORE". But using a
secondary differnence instead still sorts the test data correctly and
the previously used collation in th_TH used tertiary differences for
these characters.

There was old localedata/th_TH.in test data in TIS-620 encoding which
was not used (it was not in the localedata/Makefile). I converted this
to UTF-8 and moved it to localedata/th_TH.UTF-8.in and added it to
localedata/Makefile.

Using the existing collation rules in the th_TH locale did not sort that
test file completely correct, I think my new collation rules based on
iso14651_t1 are better.
Diffstat (limited to 'localedata/th_TH.UTF-8.in')
-rw-r--r--localedata/th_TH.UTF-8.in163
1 files changed, 163 insertions, 0 deletions
diff --git a/localedata/th_TH.UTF-8.in b/localedata/th_TH.UTF-8.in
new file mode 100644
index 0000000000..06263dda34
--- /dev/null
+++ b/localedata/th_TH.UTF-8.in
@@ -0,0 +1,163 @@
+*
+.
+๎
+์
+ฯ
+๚
+๛
+ๆ
+0
+๐
+0000
+๐๐๐๐
+10
+๑๐
+9
+๙
+9999
+๙๙๙๙
+a
+A
+๎A
+์a
+ฯä
+๚a
+๛ä
+ๆa
+b
+B
+กก
+กรรม
+กรรม์
+กราบ
+กะเกณฑ์
+กัก
+ก้าว
+กำ
+กิน
+กี่
+กึ๋น
+กุน
+กูด
+เก้ง
+เกล้า
+เกลียว
+เก้า
+เกาะ
+เกี่ยว
+เกี๊ยะ
+เกือก
+แกง
+แกะ
+โกน
+โกร๋น
+ใกล้
+ไก่
+ไกล
+ข้น
+ขนาบ
+ขาง
+ข่าง
+ข้าง
+ข้างๆ
+ข้างกระดาน
+ข้างขึ้น
+ข้างควาย
+ข้างๆ คูๆ
+ข้างเงิน
+ข้างแรม
+ข้างออก
+เข็ด
+เขน
+เข็น
+เข่น
+แข็ง
+แข่ง
+แข้ง
+แข้งขวา
+แข็งขัน
+แข่งขัน
+แขน
+แขวะ
+ฃวด
+ครรภ-
+ครรภ์
+ฅอ
+งาม
+จุมพล
+จุํพล
+ฉาก
+ชาย
+ซาบ
+ญาณ
+ฎีกา
+ฐาน
+ฑาหะ
+เฒ่า
+เณร
+ดนตรี
+ตลาด
+ถนน
+ทูลเกล้า
+ทูลเกล้าฯ
+ทูลเกล้าทูลกระหม่อม
+ธนาคาร
+น้า
+น้ำ
+นี้
+บุญญา
+บุญหลง
+ปา
+ป่า
+ป้า
+ป๊า
+ป๋า
+ปาน
+ป่าน
+ป้าน
+แป้ง
+ผัด
+ฝา
+ฯพณฯ
+พณิชย์
+ฟาง
+ภาษี
+ม้า
+ย่อง
+รอง
+ฤทธิ์
+ฤษี
+ฤๅษี
+ลลิตา
+ฦๅชา
+วก
+ศาล
+ษมา
+สกุล
+หริภุญชัย
+หฤทัย
+หลง
+แหง่
+แห่ง
+แหนม
+แหนหวง
+แหบ
+แหม
+อาน
+ฮา
+ไฮโล
+ํ
+ํä
+ะ
+ะa
+า
+ๅ
+ๅํ
+ํๅ
+ๅa
+าä
+าํ
+ํา
+ำ
+ไ
+ฺ