Breaking the Unicodex:¶
Unicode (חב״ד)¶
In [1]:
#http://www.chabad.org/library/bible_cdo/aid/16453/jewish/Chapter-1.htm
ruth = u'וַיְהִי בִּימֵי שְׁפֹט הַשֹּׁפְטִים וַיְהִי רָעָב בָּאָרֶץ'
ruth_list = ruth.split()
print(ruth_list)
print ("zeroth item = {0}".format(ruth_list[0]))
for token in ruth_list:
print(token)
['וַיְהִי', 'בִּימֵי', 'שְׁפֹט', 'הַשֹּׁפְטִים', 'וַיְהִי', 'רָעָב', 'בָּאָרֶץ']
zeroth item = וַיְהִי
וַיְהִי
בִּימֵי
שְׁפֹט
הַשֹּׁפְטִים
וַיְהִי
רָעָב
בָּאָרֶץ
QBible¶
In [6]:
#http://www.qbible.com/hebrew-old-testament/ruth/1.html#1
qbible_ruth = u'וַיְהִי בִּימֵי שְׁפֹט הַשֹּׁפְטִים וַיְהִי רָעָב בָּאָרֶץ וַיֵּלֶ אִישׁ מִבֵּית לֶחֶם יְהוּדָה לָגוּר בִּשְׂדֵי מוֹאָב הוּא וְאִשְׁתּוֹ וּשְׁנֵי בָנָיו'
qbible_ruth_list = qbible_ruth.split()
print ("zeroth item = {0}".format(qbible_ruth_list[0]))
for token in qbible_ruth_list:
print(token)
zeroth item = וַיְהִי
וַיְהִי
בִּימֵי
שְׁפֹט
הַשֹּׁפְטִים
וַיְהִי
רָעָב
בָּאָרֶץ
וַיֵּלֶ
אִישׁ
מִבֵּית
לֶחֶם
יְהוּדָה
לָגוּר
בִּשְׂדֵי
מוֹאָב
הוּא
וְאִשְׁתּוֹ
וּשְׁנֵי
בָנָיו
Bible Hub¶
In [7]:
#http://biblehub.com/text/ruth/1-16.htm
biblehub_ruth = u'וַתֹּ֤אמֶר רוּת֙ אַל־תִּפְגְּעִי־בִ֔י לְעָזְבֵ֖ךְ לָשׁ֣וּב מֵאַחֲרָ֑יִךְ כִּ֠י אֶל־אֲשֶׁ֨ר תֵּלְכִ֜י אֵלֵ֗ךְ וּבַאֲשֶׁ֤ר תָּלִ֙ינִי֙ אָלִ֔ין עַמֵּ֣ךְ עַמִּ֔י וֵאלֹהַ֖יִךְ אֱלֹהָֽי׃'
biblehub_lst = biblehub_ruth.split()
print ("zeroth item = {0}".format(biblehub_lst[0]))
for token in biblehub_lst:
print(token)
zeroth item = וַתֹּ֤אמֶר
וַתֹּ֤אמֶר
רוּת֙
אַל־תִּפְגְּעִי־בִ֔י
לְעָזְבֵ֖ךְ
לָשׁ֣וּב
מֵאַחֲרָ֑יִךְ
כִּ֠י
אֶל־אֲשֶׁ֨ר
תֵּלְכִ֜י
אֵלֵ֗ךְ
וּבַאֲשֶׁ֤ר
תָּלִ֙ינִי֙
אָלִ֔ין
עַמֵּ֣ךְ
עַמִּ֔י
וֵאלֹהַ֖יִךְ
אֱלֹהָֽי׃
In [ ]:
#bible_hub consonants only
cbible_hub_ruth = u'ותאמר רות אל־תפגעי־בי לעזבך לשוב מאחריך כי אל־אשר תלכי אלך ובאשר תליני אלין עמך עמי ואלהיך אלהי'
cbible_hub_ruth_lst = cbible_hub_ruth.split()
for token in cbible_hub_ruth.split():
print(token)
German Bible¶
In [8]:
#https://www.academic-bible.com
ruth_de = u'וַיְהִ֗י בִּימֵי֙ שְׁפֹ֣ט הַשֹּׁפְטִ֔ים וַיְהִ֥י רָעָ֖ב בָּאָ֑רֶץ וַיֵּ֨לֶךְ אִ֜ישׁ מִבֵּ֧ית לֶ֣חֶם יְהוּדָ֗ה לָגוּר֙'
for token in ruth_de.split():
print(token)
וַיְהִ֗י
בִּימֵי֙
שְׁפֹ֣ט
הַשֹּׁפְטִ֔ים
וַיְהִ֥י
רָעָ֖ב
בָּאָ֑רֶץ
וַיֵּ֨לֶךְ
אִ֜ישׁ
מִבֵּ֧ית
לֶ֣חֶם
יְהוּדָ֗ה
לָגוּר֙