കഴിഞ്ഞ അഞ്ചിലധികം വർഷങ്ങളായി നിരവധി രാജ്യങ്ങളീൽ (പ്രധാനമായും ജർമ്മനി, ഇന്ത്യ) ഇരുന്നു 250ൽ അധികം പ്രവർത്തകർ കൂട്ടായി നടത്തിയ ഗുണ്ടർട്ട് ലെഗസി പ്രൊജക്ട് എന്ന പദ്ധതിയുടെ വിശദാംശങ്ങളെ പറ്റി ഇതിനകം എല്ലാവർക്കും അറിവുള്ളത് ആണല്ലോ. പദ്ധതിയെ പറ്റി എന്റെ അനുഭവക്കുറിപ്പ് ഇതിനകം പ്രസിദ്ധീകരിച്ചു കഴിഞ്ഞതാണ്. അത് ഇവിടെ കാണാം.
സ്കാനുകൾ എല്ലാം പുറത്ത് വരികയും ഗുണ്ടർട്ട് പോർട്ടൽ ഔദ്യോഗികമായി റിലീസ് ചെയ്യുകയും ചെയ്തു എങ്കിലും പദ്ധതിയുമായി ബന്ധപ്പെട്ട സന്നദ്ധപ്രവർത്തകരുടെ പണികൾ അവസാനിച്ചിട്ടില്ല.
യൂണിക്കോഡിലാക്കിയ പുസ്തകങ്ങളുടെ സ്കാനുകൾ വിക്കിമീഡിയ കോമൺസിലേക്കും ആർക്കൈവ്.ഓർഗിലേക്കും അപ്ലൊഡ് ചെയ്യുക, യൂണിക്കോഡ് പതിപ്പ് മലയാളം വിക്കിഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്യുക തുടങ്ങി നിരവധി പണികൾ ബാക്കിയായിരുന്നു.
പദ്ധതിയിൽ അച്ചടി പുസ്തകങ്ങൾ താളിയോല അടക്കമുള്ള കൈയെഴുത്തുപ്രതികളും ഉണ്ടായിരുന്നു. അച്ചടി പുസ്തകങ്ങൾ എല്ലാം കോമൺസിലേക്ക് അപ്ലോഡ് ചെയ്തതോടെ യൂണിക്കോഡ് പതിപ്പ് മലയാളം വിക്കിഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്യുന്ന പരിപാടിയും തീർന്നു.
ഇതിലെ ബുദ്ധിമുട്ട് പിടിച്ച പണി സ്കാനുകൾ ട്യൂബിങ്ങൻ സെർവ്വറിൽ നിന്ന് ഡൗൺലോഡ് ചെയ്ത്, പിന്നെ വിക്കിമീഡിയ കോമൺസിലേക്ക് അപ്ലൊഡ് ചെയ്യുന്നത് ആയിരുന്നു. റോജി പാല, ശ്രീജിത്ത് കെ., റസിമാൻ എന്നിവർ ചേർന്നാണ് ഈ ഡൗൺലോഡ് -അപ്ലോഡ് പരിപാടി ചെയ്തത്. ഫയലുകൾ എല്ലാം ഹെവി ആയിരുന്നതിനാൽ https://www.internetdownloadmanager.com/ എന്ന ടൂൾ ഉപയോഗിച്ചായിരുന്നു ഞാൻ ഡൗൺലോഡ് ചെയ്തത്. ഫയലുകൾ വിക്കിമീഡിയ കോമൺസിൽ എത്തിയതോടെ സെർവ്വർ സ്പീഡും മറ്റും മെച്ചമാണ് എന്നതിനാൽ ഇനി ഡൗൺലോഡിങ് എളുപ്പത്തിൽ നടക്കും.
വിക്കിഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്യുന്ന പണി ഏകദേശം ഒറ്റയ്ക്ക് റസിമാൻ ആണ് ചെയ്തത്. അവസാനം വിക്കിമീഡിയ കോമൺസിൽ നിന്ന് ലിങ്കുകൾ ശേഖരിച്ച് അടുക്കിപെറുക്കുന്ന പണി റോജി പാലയും ചെയ്തു. ഇത് എല്ലാം പൂർത്തിയായത് കൊണ്ടാണ് ഇപ്പോൾ ഈ പട്ടിക നിർമ്മിക്കാൻ പറ്റിയത്.
ഈ കാര്യത്തിൽ സഹകരിച്ച എല്ലാവർക്കും നിസ്സീമമായ നന്ദി.
ഇപ്പോൾ അച്ചടി പുസ്തകങ്ങൾ എല്ലാം അപ്ലോഡ് ചെയ്യുകയും യൂണിക്കോഡ് പതിപ്പ് മൈഗ്രേറ്റ് ചെയ്യുകയും ചെയ്തതിനാൽ, ഉപയോഗിക്കുന്നവരുടെ സൗകര്യത്തിന്നു ഇതെല്ലാം കൂടെ സമാഹരിച്ച് ഒരു സ്പ്രെഡ് ഷീറ്റാക്കി പ്രസിദ്ധീകരിക്കുന്നു. താഴെ പറയുന്ന മൂന്നു ഷീറ്റുകൾ ആണ് പങ്കു വെക്കുന്നത്:
- യൂണിക്കോഡിലാക്കിയ ലെറ്റർ പ്രസ്സ് അച്ചടി പുസ്തകങ്ങൾ (100 എണ്ണം)
- യൂണിക്കോഡിലാക്കിയ കല്ലച്ചടി പുസ്തകങ്ങൾ (37 എണ്ണം)
- യൂണിക്കോഡിലാക്കാത്ത ലെറ്റർ പ്രസ്സ്/കല്ലച്ചടി പുസ്തകങ്ങൾ (30 എണ്ണം)
ഇതിൽ ആദ്യത്തെ രണ്ട് പട്ടികയിൽ പുസ്തകത്തിന്റെ പേര്, പ്രസ്സ്, താളുകളുടെ എണ്ണം, ട്യൂബിങ്ങൻ ലൈബ്രറി ലിങ്ക്, ഡൗൺലൊഡ് സൈസ്, ഡൗൺലോഡ് ലിങ്ക്, വിക്കിഗ്രന്ഥശാല കണ്ണി (യൂണീക്കോഡ് പതിപ്പിനായി) എന്നിവ കൊടുത്തിരിക്കുന്നു. മൂന്നാമത്തെ പട്ടികയിൽ വിക്കിഗ്രന്ഥശാല കണ്ണി ഒഴിച്ച് (ആ പുസ്തകങ്ങൾ യൂണീക്കോഡ് ആക്കത്തതിനാൽ) ബാക്കി എല്ലാം ഉണ്ട്.
മൊത്തം 36,141 താളുകൾ ആണ് ഈ 167 പുസ്തകങ്ങളിൽ ഉള്ളത്. അതിൽ 25,592 താളുകൾ യൂണിക്കോഡാക്കി. ബാക്കി 10,549 താളുകൾ യൂണിക്കോഡാക്കുക എന്നത് വിക്കിഗ്രന്ഥശാലയിലും മറ്റു പ്രസ്ഥാനങ്ങളിലും ഉള്ള പ്രവർത്തകരുടെ ചുമതല ആണ്.
ഇതെല്ലാം കൂടെ ഡൗൺലോഡ് ചെയ്യാൻ നിന്നാൽ വലിയ പണിയാണ്. ആദ്യത്തെ പട്ടികയിലെ 100 പുസ്തകങ്ങൾ തന്നെ 22 GB വരും. രണ്ടാമത്തെ പട്ടികയിലെ 37 പുസ്തകങ്ങൾ ചേർന്ന് 9 GB വരും. മൂന്നമത്തെ പട്ടികയിലെ 30 പുസ്തകങ്ങൾ ചേർന്ന് 11 GB വരും. അതായത് ഈ 167 പുസ്തകങ്ങളും കൂടി 42 GB സൈസ് വരും. ഡൗൺലോഡ് ചെയ്യാൻ ഉദ്ദേശിക്കുന്നവർ https://www.internetdownloadmanager.com/ പോലുള്ള ടൂളുകൾ ഉപയോഗിച്ച് ഡൗൺലോഡ് ചെയ്യുന്നതാവും നല്ലത്. ഞാൻ അങ്ങനെ ചെയ്തപ്പൊഴേ വലിയ ഫയലുകൾ ഡൗൺലോഡ് ചെയ്യാൻ കഴിഞ്ഞുള്ളൂ. ഡൗൺലോഡ് ചെയ്യുന്നവർ വിക്കിമീഡിയ കോമൺസിന്റെ ഡൗൺലോഡ് കണ്ണി ഉപയോഗിക്കുന്നതാണ് നല്ലത്. അതിൽ നിന്നുള്ള ഡൗൺലോഡിങ് എളുപ്പം നടക്കും.
വിക്കിഗ്രന്ഥശാല കണ്ണി ഉപയോഗിച്ച് എത്തുന്ന ഒരു പുസ്തകത്തിന്റെ ഇൻഡെക്സ് പേജിൽ നിന്ന് ക്ലിക്ക് ചെയ്താൽ ഓരോ പേജിന്റെയും യൂണിക്കോഡ് പതിപ്പും കിട്ടും. യൂണിക്കോഡ് പതിപ്പ് ഒക്കെ ഉപയോഗിച്ച് പുനഃപ്രസിദ്ധീകരണം നടത്താനുള്ള വലിയ സാദ്ധ്യതയാണ് തുറന്നിരിക്കുന്നത്. അങ്ങനെ ചെയ്യുന്നവർ ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റിക്ക് തക്കതായ കടപ്പാട് രേഖപ്പെടുത്താനുള്ള സാമാന്യ മര്യാദ കാണിക്കും എന്ന് കരുതട്ടെ.
പതിവുപോലെ ഇത് സാദ്ധ്യമാക്കിയ ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റിക്കും പദ്ധതിയുമായി ബന്ധപ്പെട്ട എല്ലാവർക്കും നന്ദിയും കടപ്പാടും രേഖപ്പെടുത്തട്ടെ.
മൂന്നു പട്ടികകളും താഴെ കൊടുക്കുന്നു. വെറിക്കലായും ഹൊറിസോണ്ടലായും സ്ക്രോൾ ചെയ്താൽ ഒരോ പട്ടികയിലേയും എല്ലാം കോളങ്ങളും എല്ലാ റോകളും കാണാവുന്നതാണ്. (ഈ സ്പ്രെഡ് ഷീറ്റ് നേരിട്ട് ആക്സെസ് ചെയ്യാനുള്ള കണ്ണി ഇവിടെ)
You must be logged in to post a comment.