ആമുഖം
കേരളവുമായി ബന്ധപ്പെട്ട പൊതുസഞ്ചയരേഖകൾ ഡിജിറ്റൈസ് ചെയ്ത് പൊതുവായി പങ്കു വെക്കുന്ന ഒരു സന്നദ്ധപ്രവർത്തകൻ എന്ന നിലയിൽ 2012-2013ൽ ട്യൂബിങ്ങൻ സർവ്വകലാശാലയിലേക്ക് അയച്ച ഒരു ഇമെയിൽ സന്ദേശം ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി എന്ന പേരിൽ ഒരു ബൃഹദ് പദ്ധതി ആയി വളർന്നതിനെ കുറിച്ചും, ആ പദ്ധതിയിൽ ഒരു പ്രധാനപങ്കു വഹിക്കാൻ കഴിഞ്ഞ സന്നദ്ധപ്രവർത്തകൻ എന്ന നിലയിലും ഉള്ള എന്റെ അനുഭവക്കുറിപ്പ് ആണ് ഈ ലേഖനം.
ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി – അനുഭവക്കുറിപ്പ് – Image Courtesy – Rajesh Odayanchal
പദ്ധതിയിൽ ഞാൻ പങ്കാളിയായ സംഗതികളുടെ വിശകലനം എന്റെ വീക്ഷണകോണിലൂടെ അവതരിപ്പിക്കുന്നതിനാൽ ഈ അനുഭവക്കുറിപ്പ് എന്റെ മാത്രം അഭിപ്രായങ്ങൾ ആണ്. പക്ഷെ ഈ പദ്ധതിയിൽ ആദ്യന്തം ഉണ്ടായിരുന്ന ഒരാൾ എന്ന നിലയിൽ പദ്ധതിയുടെ നാൾവഴിയും ചരിത്രവും ഞാൻ ഉൾപ്പെട്ട പ്രവർത്തങ്ങളുടെ വിശദാംശങ്ങളും എല്ലാം ഒരു പരിധി വരെ ഈ അനുഭവക്കുറിപ്പിൽ നിന്നു കിട്ടും. ഞാൻ ഉൾപ്പെടാത്ത സംഗതികളും പദ്ധതിയുടെ ഭാഗമായി ഉണ്ട് എന്നതിനാൽ ഈ അനുഭവക്കുറിപ്പിനെ പദ്ധതിയുടെ മൊത്തത്തിലുള്ള ഡോക്കുമെന്റേഷനായി കാണരുത്.
സാമാന്യം വലിപ്പമുള്ള അനുഭവക്കുറിപ്പ് ആണിത്. പദ്ധതിയിൽ ഞങ്ങൾ നടത്തിയ ഇടപെടലുകളുടെ വിവരം ഡോക്കുമെന്റ് ചെയ്യപ്പെടേണ്ടതുണ്ട് എന്നതിനാലാണ് എല്ലാ കാര്യങ്ങളും സൂക്ഷ്മമായി എഴുതിയത്. പദ്ധതിയെ പറ്റി പൊതുസമൂഹത്തിനുള്ള ചോദ്യങ്ങൾ മിക്കവാറും എണ്ണത്തിനുമുള്ള ഉത്തരം ഈ അനുഭവിക്കുറിപ്പ് തരുമെന്ന് പ്രതീക്ഷിക്കുന്നു.
പദ്ധതിയുടെ തുടക്കം
മലയാള പൊതുസഞ്ചയ രേഖകളുടെ ഡിജിറ്റൈസേഷൻ എന്ന വിഷയം മലയാളം വിക്കിമീഡിയ പദ്ധതികളിൽ ഞാൻ അംഗമായി ചേർന്ന 2006 തൊട്ടെങ്കിലും എനിക്കു കൈകാര്യം ചെയ്യേണ്ടി വന്നിട്ടുണ്ട്. അതിൽ തന്നെ 2009 തൊട്ടെങ്കിലും സുഹൃത്തുക്കളുടെ സഹായത്തോടെയോ ഞാൻ നേരിട്ടോ മലയാള പൊതുസഞ്ചയരേഖകൾ ഡിജിറ്റൈസ് ചെയ്ത് രേഖകൾ പൊതുവായി ആദ്യഘട്ടത്തിൽ ഓർക്കുട്ട്/ഗൂഗിൾ ബസ്സ്/ഗൂഗിൾ പ്ലസ്സ് തുടങ്ങിയ സോഷ്യൽ മീഡിയ പ്ലാറ്റ്ഫോമികളിലൂടെയും പിന്നീട് എന്റെ ബ്ലോഗിലൂടെയും (https://shijualex.in) എല്ലാവരുമായും പങ്കു വെക്കുകയും ചെയ്യുന്നു.
ഈ മേഖലയിൽ (മലയാള പൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷൻ) പ്രവർത്തിക്കുന്ന ഏതൊരാൾക്കും പി.ജെ. തോമസ്. ഡോ. സ്കറിയ സക്കറിയ, കെ. എം. ഗോവി, എന്നിവരുടെ വിവിധ ഡോക്കുമെന്റേഷനുകളിലൂടെ കടന്നു പോവാതെ തരമില്ല. കാരണം ഇവർ മൂവരും ആണ് അച്ചടിച്ച മലയാള രേഖകളെ പറ്റി ഏറ്റവും ആധികാരികമായ ഡോക്കുമെന്റേഷൻ നടത്തിയിരിക്കുന്നത്. ഇവരുടെ ലേഖനങ്ങളിലൂടെ കടന്നു പോകുമ്പോൾ ജർമ്മനിയിലെ ട്യൂബിങ്ങൻ സർവ്വകലാശാലയിൽ പുരാതന മലയാളഗ്രന്ഥങ്ങളുടെ വലിയ ഒരു ശേഖരം ഉണ്ടെന്ന് നമുക്കു മനസ്സിലാകും. ഈ ലേഖനങ്ങളിലൂടെ കിട്ടിയ അറിവാണ് ട്യൂബിങ്ങനിലെ രേഖകൾ ഏതെങ്കിലും വിധത്തിൽ ഡിജിറ്റൈസ് ചെയ്ത് പൊതു ഇടത്തിലേക്ക് കൊണ്ടുവരാൻ പറ്റുമോ എന്ന ചിന്തയ്ക്ക് എനിക്കു പ്രേരണയായത്.
മലയാളപൊതുസഞ്ചയരേഖകൾ ഡിജിറ്റൈസ് ചെയ്യാനുള്ള സാദ്ധ്യത തേടി 2012ൽ കേരളത്തിലേയും കേരളത്തിന്നു പുറത്തേയും നിരവധി സ്ഥാപനങ്ങൾക്ക് ഞാൻ മെയിൽ അയക്കുന്നുണ്ട്. അങ്ങനെ അയച്ച മെയിലുകളിൽ ഒരെണ്ണം വലിയ മലയാളഗ്രന്ഥശേഖരം ഉണ്ടെന്ന് ഇതിനകം എനിക്കു മനസ്സിലായ ട്യൂബിങ്ങൻ സർവ്വകലാശാലയിലേക്ക് ആയിരുന്നു. ട്യൂബിങ്ങനിലേക്കുള്ള മെയിൽ ഏതെങ്കിലും ഒരു ഐഡിയിലേക്ക് അയക്കാതെ ഇന്ത്യയും കേരളവുമായി കുറച്ചൊക്കെ ബന്ധം ഉണ്ടെന്ന് കണ്ട ഇൻഡോളജി ഡിപ്പാർട്ട്മെന്റിൽ പ്രൊഫസ്സറായ ഹൈക്കെ മോസർക്ക് അയക്കുക ആയിരുന്നു ഞാൻ ചെയ്തത്.
അന്നു മെയിൽ അയക്കുമ്പോൾ എന്റെ മനസ്സിലുള്ള ആശയം ഒരു പക്ഷെ ഇവർ ആ രേഖ ആക്സെസ് ചെയ്യാൻ സമ്മതിക്കുക ആണെങ്കിൽ, വിക്കിമീഡിയ ജർമ്മനിയുടെ സഹായത്തോടു കൂടെയോ, ക്രൗഡ് ഫണ്ടിങ്ങോ ഉപയോഗിച്ച് അത് ഡിജിറ്റൈസ് ചെയ്യാനുള്ള ഒരു പദ്ധതി ആവിഷ്കരിക്കുക എന്നതായിരുന്നു. (ഇന്നാണെങ്കിൽ സ്വപ്നനത്തിൽ പോലും ഞാൻ അങ്ങനെ ചിന്തിക്കില്ല, കാരണം ഇതുമായി ബന്ധപ്പെട്ട സങ്കീർണ്ണത എത്രയാണെന്നു ഇന്നു എനിക്കറിയാം)
എന്നാൽ എന്നെ അത്ഭുതപ്പെടുത്തി കൊണ്ട് ഹൈക്കെ എന്റെ മെയിലിനു ഉടനടി മറുപടി അയച്ചു. വെറുതെ മറുപടി അയക്കുക മാത്രമല്ല ട്യൂബിങ്ങൻ ലൈബ്രറിയിലെ വിവിധ ആളുകളുമായി സംസാരിക്കുകയും ഗുണ്ടർട്ട് ശേഖരം മൊത്തമായി ഡിജിറ്റൈസ് ചെയ്യാനുള്ള സാദ്ധ്യതയും സൂചിപ്പിച്ചാണ് മറുപടി വന്നത്.
ആദ്യഘട്ട ചർച്ചകൾ
പിന്നീടുള്ള മാസങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യാനുള്ള ഫണ്ട് നേടിയെടുക്കാനുള്ള പ്രൊപ്പൊസലുകൾ തയ്യാറാക്കാനുമുള്ള പണികൾ ആയിരുന്നു. ഈ സമയത്ത് മലയാളം ശേഖരത്തിന്റെ കാറ്റലോഗ് ലിസ്റ്റ് മൊത്തം കൈമാറുകയും പ്രയോറൈറ്റൈസ് ചെയ്യാൻ സഹായം ചോദിക്കുകയും ഒക്കെ ചെയ്യുന്നുണ്ട്. ഇതുമായി ബന്ധപ്പെട്ട പണികളിൽ എന്നെ അക്കാലത്ത് സഹായിച്ചത് സുനിലും സിബുവും കെവിനും ആയിരുന്നു.
കൊച്ചിയിൽ വെച്ച് പദ്ധതി ഔദ്യോഗികമായി അനൗൺസ് ചെയ്യുന്നു
ഡിജിറ്റൈസേഷൻ പ്രൊപ്പൊസലിന്റെ പണി നടന്നു കൊണ്ടു ഇരിക്കുന്നതിന്റെ ഇടയിൽ 2013 സെപ്റ്റംബറിൽ മൂഴിക്കുളത്ത് നടക്കുന്ന കൂടിയാട്ടം ഫെസ്റ്റിവലിൽ പങ്കെടുക്കാൻ കേരളത്തിലേക്ക് വരുന്നു എന്നു പറഞ്ഞു ഹൈക്കെ മോസർ എനിക്കു മെയിൽ അയച്ചു. അത് അറിയിച്ചപ്പോൾ എന്തായാലും ഗുണ്ടർട്ട് ശേഖരം ഡിജിറ്റൈസ് ചെയ്യാൻ ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റി ഔദ്യോഗികമായി തീരുമാനിച്ചിട്ടുണ്ട്, എങ്കിൽ ഈ വിഷയം പൊതുജനങ്ങളെ അറിയിച്ചു കൊണ്ട് ചെറിയ ഒരു പരിപാടി കേരളത്തിൽ നടത്തിക്കൂടേ എന്നും അതിനു സമ്മതിക്കുക ആണെങ്കിൽ അതിനു വേദിയൊരുക്കാം എന്നും ഹൈക്കയോടു അഭ്യർത്ഥിച്ചു. മനസ്സില്ലാ മനസ്സോടെ (അതിനു കാരണം ഉണ്ട്, പദ്ധതി ഔദ്യോഗികമായി ആരംഭിച്ചിട്ടും ഇല്ല, ഫണ്ടിങ്ങും ആയിട്ടില്ല) ഹൈക്കെ അതിനു സമ്മതിച്ചു.
പരിപാടി തീരുമാനിച്ചപ്പോൾ, പദ്ധതി അനൗൺസ് ചെയ്താൽ ജനശ്രദ്ധ ഉണ്ടാകും; ആതിനാൽ ശേഖരത്തിലെ ഒന്നോ രണ്ടോ സ്കാനുകൾ കൂടെ ആ പരിപാടിയിൽ വെച്ച് കാണിക്കുന്നതും കൈമാറുന്നതും നല്ലതാവില്ലെ എന്ന ചിന്ത എനിക്കുണ്ടായി. ഇതു ഹൈക്കയുമായി പങ്കു വെച്ചപ്പോൾ അതിനുള്ള സാദ്ധ്യത ഹൈക്കെ, ഗബ്രിയേല സെല്ലറുമായും ചർച്ച ചെയ്യുകയും 2 പുസ്തകങ്ങളുടെ ഡിജിറ്റൽ സ്കാൻ പരിപാടിയിൽ വെച്ച് നമുക്കു കൈമാറാം എന്നു സമ്മതിക്കുകയും ചെയ്തു.
തുടർന്ന് നിരവധി എഴുത്തുകുത്തുകൾക്കും ഫോൺവിളികൾക്കും ശേഷം കൊച്ചിയിലെ പ്രസ്സ് അക്കാദമിയിൽ വെച്ചു ചെറിയൊരു പരിപാടിയിലൂടെ ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി അനൗൺസ് ചെയ്യാൻ തീരുമാനിച്ചു. ഈ പരിപാടിക്കായി പ്രസ്സ് അക്കാദമി സംഘടിപ്പിക്കുകയും അതിനു വേണ്ടിയുള്ള ബാക്ക് ഗ്രൗണ്ട് പണികൾ ഒക്കെയും ചെയ്തത് ശ്രീ സുനിൽ പ്രഭാകർ ആണ്. (എനിക്കു നേരിട്ടു പ്രസ്സ് അക്കാദമിക്കാരെ അറിയില്ല). സുനിൽ പ്രഭാകറിന്റെ സവിശേഷ സഹായം മൂലമാണ് ഈ പരിപാടി നടത്താനുള്ള വഴികൾ തുറന്നത്.
അങ്ങനെ 2013 സെപ്റ്റംബർ 12നു കൊച്ചിയിലെ പ്രസ്സ് അക്കാദമിയിൽ വെച്ചു നടന്ന പരിപാടിയിൽ വെച്ച് ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി ഔദ്യോഗികമായി അനൗൺസ് ചെയ്യപ്പെട്ടു. ഡോ. സ്കറിയ സക്കറിയ അദ്ധ്യക്ഷത വഹിച്ച ചടങ്ങിൽ അദ്ദേഹം ഗുണ്ടർട്ട് രേഖകളുടെ പ്രാധാന്യത്തെ പറ്റിയും ഈ രേഖകൾ കൈകാര്യം ചെയ്ത തനിക്കുണ്ടായ അനുഭവത്തെ കുറിച്ചും മറ്റും പ്രസംഗിച്ചു. മറ്റു കാര്യ പരിപാടികൾ സുനിൽ പ്രഭാകർ, അജയ് ബാലചന്ദ്രൻ, വിശ്വപ്രഭ എന്നിവർ നേതൃത്വം നൽകി. (നിർഭാഗ്യവശാൽ ഓഫീസിൽ നിന്നു ലീവ് കിട്ടാഞ്ഞതിനാൽ എനിക്കു ഈ പരിപാടിയിൽ നേരിട്ടു പങ്കെടുക്കാൻ കഴിഞ്ഞില്ല)
ഈ പരിപാടിയിൽ വെച്ച് 2 സ്കാനുകൾ (1845ലെ പഴഞ്ചൊൽ മാല, 1850ലെ ഒര ആയിരം പഴംചൊൽ) റിലീസ് ചെയ്കയും പൊതുജനം ആദ്യമായി ട്യൂബിങ്ങനിലെ മലയാള രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യാനുള്ള പദ്ധതിയെ പറ്റി അറിയുകയും ചെയ്തു.
സ്കാനുകളിൽ ഒരെണ്ണമായ ഒരായിരം പഴംചൊൽ എന്ന പുസ്തകം കുറച്ചു സ്കൂൾ കുട്ടികൾ ചേർന്ന് യൂണിക്കോഡിൽ ടൈപ്പ് ചെയ്തു. ഇതുപയോഗിച്ച് സായാഹ്ന ഫൗണ്ടേഷൻ ഒരു ഇ ബുക്ക് പുറത്തിറക്കുകയും ചെയ്തു. ഇത് പരിപാടിയിൽ സവിശേഷശ്രദ്ധപിടിച്ചു പറ്റിയ സംഗതി ആയിരുന്നു.
2013 സെപ്റ്റംബർ 12നു നടന്ന പരിപാടിയെ പറ്റി അക്കാലത്ത് തന്നെ വിശദമായി ഞാൻ ബ്ലോഗ് പൊസ്റ്റ് എഴുതിയിരുന്നു. അത് ഇവിടെ കാണാം.
ഫണ്ടിങ്ങിനായുള്ള ഓട്ടം
പരിപാടി കഴിഞ്ഞ് ഹൈക്കെ ജർമ്മനിക്കു തിരിച്ചു പോയി. പിന്നീടുള്ള കുറച്ചധികം മാസങ്ങൾ (സത്യത്തിൽ ഏതാണ്ട് 2 വർഷത്തോളം) പദ്ധതിക്ക് ഫണ്ടിങ് നേടിയെടുക്കാൻ വേണ്ടിയുള്ള പ്രയത്നത്തിൽ ആയിരുന്നു ഹൈക്കെ മോസറും ഗബ്രിയേല സെല്ലറും കൂട്ടരും.
അതിനായി റെക്കമെന്റെഷൻ ലെറ്റർ തയ്യാറാക്കാൻ ഹൈക്കെ ഞങ്ങളുടെ സഹായവും തേടിയിരുന്നു. മൂന്നു റെക്കമെന്റേഷൻ ലെറ്റർ ആണ് ഞങ്ങൾ കൊടുത്തത്, അതിൽ എടുത്ത് പറയേണ്ടത് മലയാളം വിക്കിമീഡിയ സമൂഹത്തിന്റെയും സാഹാഹ്ന ഫൗണ്ടേഷന്റെയും എഴുത്തുകൾ ആണ്. ഈ കത്തുകൾ തയ്യാറാക്കാൻ സാഹാഹ്ന ഫൗണ്ടെഷൻ സാരഥി ശ്രീ രാധാകൃഷ്ണൻ സാറും, വിശ്വപ്രഭ, അജയ് ബാലചന്ദ്രൻ, കണ്ണൻ ഷണ്മുഖം, സുനിൽ വി.എസ്., സിബു സി.ജെ. എന്നിവരും സഹായിച്ചു. ഇതൊക്കെയും ഞങ്ങൾക്കു പുതു അനുഭവങ്ങൾ ആയിരുന്നു.
ഫണ്ടിങിനായുള്ള അപേക്ഷ സമർപ്പണവും ജർമ്മൻ റിസർച്ച് ഫൗണ്ടെഷനുമായുള്ള ചർച്ചയും മറ്റും ക്രമമായി നടന്നു. പക്ഷെ അനുമതിയുടെ ഭാഗമായി ശേഖരത്തിലെ അച്ചടിപുസ്തകങ്ങളിലെ 26,000 ത്തോളം താളുകൾ മലയാളം യൂണിക്കോഡ് ആക്കണം എന്ന ഒരു നിബന്ധന ഉണ്ടായിരുന്നു. അങ്ങനെ സ്കാനിങ്ങിനു പുറമേ മലയാളരേഖകളുടെ യൂണിക്കോഡ് കൺവേർഷനും പദ്ധതിയുടെ ഭാഗമായി.
യൂണിക്കോഡ് കൺവേർഷൻ
ഒന്നോ രണ്ടോ പുസ്തകങ്ങളോ ഏതാനും നൂറു താളുകളോ ഒക്കെ യൂണിക്കോഡ് ആക്കുന്നത് തന്നെ എന്ത് തലവേദന പിടിച്ച പണി ആണെന്ന് മലയാളം വിക്കിഗ്രന്ഥശാലയിലെ പ്രവർത്തിപരിചയത്തിൽ നിന്നു എനിക്കു അറിയാം. അങ്ങനെ ഒരു സ്ഥിതിയിലാണ് ഏതാണ്ട് 136 പുസ്തകങ്ങളിലെ 26,000 ത്തോളം താളുകൾ പ്രത്യേക ഗുണനിലവാര മാനദണ്ഡങ്ങളോടെ യൂണിക്കോഡിൽ ആക്കാൻ ഹൈക്കെ മോസർ സഹായം അഭ്യർത്ഥിക്കുന്നത്.
ഇതു എന്നെ വിഷമത്തിലാക്കി. ആ സമയത്തെ എന്റെ വലിയ പേടി ഇതു ചെയ്തു കൊടുക്കാൻ പറ്റിയില്ലെങ്കിൽ ഗുണ്ടർട്ട് ശേഖരം ഡിജിറ്റൈസ് ചെയ്തു കിട്ടില്ലേ എന്നതായിരുന്നു. ഇത്രവലിയ ഒരു സംഗതി ചെയ്യുന്നതിനു ഞങ്ങൾക്കു മുന്നിൽ അനുകരിക്കാവുന്ന മോഡലുകളും ഉണ്ടായിരുന്നില്ല. ചുരുക്കത്തിൽ ആ സമയത്ത് ഞങ്ങൾ ഇരുട്ടിൽ തപ്പുക ആയിരുന്നു. പറ്റുന്ന പോലെ ഏതാനും ആയിരം താളുകൾ ചെയ്യാമെന്നും ബാക്കി സ്കൂൾ കുട്ടികളെ പദ്ധതിയുടെ ഭാഗമാക്കി ചെയ്യിക്കാം എന്ന ഒരു പരിഹാരമാണ് അക്കാലത്ത് മനസ്സിൽ തെളിഞ്ഞത്.
ഈ പദ്ധതിക്ക് മുന്നേറാനുള്ള ഓരോ വഴിയും ദുർഘടങ്ങൾ വരുന്ന മുറയ്ക്ക് ഞങ്ങൾ വെട്ടി എടുക്കുക ആയിരുന്നു.
സ്കൂൾ കൂട്ടികളെ ഉൾപ്പെടുത്താനുള്ള ശ്രമം
2013 സെപ്റ്റംബർ 12ലെ പ്രോഗ്രാമിൽ സ്കൂൾ കുട്ടികൾ ഒരായിരം പഴംചൊൽ എന്ന പുസ്തകം യൂണിക്കോഡ് ആക്കിയതിനാൽ കേരളത്തിലെ പൊതുവിദ്യാലയങ്ങളിലെ സ്കൂൾ കുട്ടികളെ ഉപയോഗിച്ച് ശേഖരത്തിലെ ഒരു പ്രധാന പങ്കു മലയാളം യൂണിക്കോഡിലാക്കുന്ന പദ്ധതി ആണ് ആദ്യം ആലൊചിച്ചത്. കേരളചരിത്രം, സംസ്കാരം, പൈതൃകം ഇതൊക്കെയായി നേരിട്ടു ഇളംതലമുറയ്ക്കു കണക്ട് ചെയ്യാൻ പറ്റുന്ന പദ്ധതിയായിരുന്നതിനാലും ഒരു അന്താരാഷ്ട്ര പദ്ധതി ആയതിനാലും കേരളസർക്കാർ ഔദ്യോഗികമായി ഈ പദ്ധതിയിൽ സഹകരിക്കും എന്നു ഞങ്ങൾ പ്രതീക്ഷിച്ചു. ആയിരക്കണക്കിനു സ്കൂൾ കുട്ടികൾ ഉണ്ടാവും എന്നതിനാൽ യൂണിക്കോഡ് കൺവേർഷൻ പദ്ധതി എതാനും മാസം കൊണ്ട് തീർക്കുകയും ചെയ്യാം എന്ന ലോജിക്കും ഇതിനു പിന്നിൽ ഉണ്ടായിരുന്നു.
ഇതിനുള്ള സാദ്ധ്യത തേടി അവധിക്കാലം ചിലവഴിക്കാൻ കേരളത്തിൽ വന്ന ഹൈക്കെ ഒബർലിൻ(മോസർ), എലീന എന്നിവരും പിന്നെ കണ്ണൻ മാഷും ഞാനും വിവിധ കേരളസർക്കാർ ഉദ്യോഗസ്ഥരെ 2013, 2014, 2015, കാലഘട്ടത്തിൽ കണ്ടു. പക്ഷെ ചർച്ച നടന്നു എന്നല്ലാതെ കാര്യങ്ങൾക്ക് ആശാവഹമായ യാതൊരു പുരോഗതിയും ഉണ്ടായില്ല. അതിനാൽ നിവൃത്തികെട്ടു പൊതുവിദ്യാലയങ്ങളിലെ സ്കൂൾ കുട്ടികളെ ഔദ്യോഗികമായി പദ്ധതിയിൽ ഉൾപ്പെടുത്താനുള്ള ശ്രമം ഉപേക്ഷിച്ചു.
ഇന്നു തിരിഞ്ഞു നോക്കുമ്പോൾ സ്കൂൾ കുട്ടികളെ ഉൾപ്പെടുത്താനുള്ള തീരുമാനം നടക്കാഞ്ഞത് നന്നായെന്നു ഞാൻ പറയും. പദ്ധതിയിലെ കർശനമായ ഗുണനിലവാരമാനദണ്ഡങ്ങളും രാഷ്ട്രീയവിവാദങ്ങൾ ഉണ്ടാകാനുള്ള സാദ്ധ്യതയും പരിഗണിക്കുമ്പോൾ ആ വിധത്തിൽ പദ്ധതി നടക്കാഞ്ഞത് നന്നായി. ചുരുക്കത്തിൽ സ്കൂൾകുട്ടികളുടെ കാര്യം ശ്രമിക്കാഞ്ഞതല്ല, ശ്രമിച്ചിട്ടും നടക്കാഞ്ഞതാണ്. പക്ഷെ നടക്കാഞ്ഞത് നന്നായെന്ന് ഇപ്പോൾ തോന്നുകയും ചെയ്യുന്നു.
പദ്ധതിക്കു ജർമ്മൻ റിസർച്ച് ഫൗണ്ടേഷന്റെ അനുമതി കിട്ടുന്നു
ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റിയെ സംബന്ധിച്ചിടത്തോളം അവരുടെ ഇൻഡോളജി ഡിപ്പാർട്ട്മെന്റിന്റെ പദ്ധതി ആണിത്. അവിടെ മലയാളത്തിന്നു പുറമെ മറ്റു തെക്കേന്ത്യൻ ഭാഷകളിലുള്ള രേഖകളും ഉണ്ട്. രേഖകളുടെ എണ്ണം കൊണ്ടും പ്രത്യ്രേകത കൊണ്ടും മലയാളം പ്രധാനശേഖരം ആണെങ്കിലും മലയാളത്തിന്നു പുറമെ കന്നഡ, തമിഴ്, തെലുങ്ക്, തുളു, സംസ്കൃതം എന്നീ ഇന്ത്യൻ ഭാഷകളിലും തെക്കേഇന്ത്യയെ സംബന്ധിച്ച ഇംഗ്ലീഷ്, ജർമ്മൻ ഭാഷകളിലും ഉള്ള രേഖകൾ അടങ്ങുന്ന വലിയ ശേഖരം അവർക്കുണ്ട്. ഇത് ഭൂരിപക്ഷവും ബാസൽ മിഷനുമായി ബന്ധപ്പെട്ടത് ആണ് താനും. അതിനാൽ ഈ രേഖകൾ എല്ലാം ഉൾപ്പെടുത്തി വിപുലമായ ഒരു പ്രൊപ്പോസൽ ആണ് യൂണിവേഴ്സിറ്റി ഫണ്ടീങ് ഏജൻസിയായ ജർമ്മൻ റിസർച്ച് ഫൗണ്ടേഷനു (Deutsche Forschungsgemeinschaft) സമർപ്പിച്ചത്. ഇത്രയും ഭാഷകളിലെ 849 രേഖകളിലുള്ള 1,37,148 താളുകൾ ഡിജിറ്റൈസ് ചെയ്യാനുള്ള പദ്ധതി ആയിരുന്നു സമർപ്പിച്ചത്.
2016 പകുതിയൊടെ ഗുണ്ടർട്ട് ലെഗസി പദ്ധതിക്ക് ഫണ്ടിങ് അനുമതി കിട്ടുകയും പതുക്കെ അവർ സ്കാനിങും മറ്റും ആരംഭിക്കയും ചെയ്തു.
എന്റെ ജർമ്മനി യാത്ര
2016 ഒക്ടോബറിൽ എനിക്കു എന്റെ ഔദ്യോഗിക ജോലിയുടെ ഭാഗമായി ജർമ്മനിയിൽ രണ്ടാഴ്ചത്തേക്ക് പോകേണ്ടി വന്നു. ആ സമയത്ത് വാരാന്ത്യത്തിൽ ഒരു ദിവസം എനിക്കു ജോലിയിൽ ഒഴിവ് കിട്ടിയപ്പോൾ ഞാൻ ഒന്നും ആലൊചിക്കാതെ ട്യൂബിങ്ങനു വണ്ടി കയറി. ഞാൻ ജർമ്മനിയിൽ എത്തി എന്നു അറിഞ്ഞപ്പോൾ മുതൽ ഹൈക്കെ ട്യൂബിങ്ങനിൽ വരാൻ നിർബന്ധിക്കുകയും ചെയ്തിരുന്നു. ബവേറിയയിലെ സീ ഫെൽഡ് എന്ന സ്ഥലത്ത് നിന്നു ട്രെയിനിലാണ് ഞാൻ ട്യൂബിങ്ങനിൽ എത്തിയത്. ഇതിനായി 2 ട്രെയിൻ മാറിക്കയറി എന്നു ഇപ്പോൾ ഓർക്കുന്നു. ട്യൂബിങ്ങൻ ട്രെയിൻ സ്റ്റെഷനിൽ ഹൈക്കയും എലീനയും വന്നിരുന്നു. അവരെ രണ്ടു പേരെയും അവിടെ വെച്ചാണ് ഞാൻ ആദ്യമായി കാണുന്നത്. അവർ എന്നെ ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റിയും ലൈബ്രറിയും ഡിജിറ്റൈസേഷൻ പരിപാടികളും ഒക്കെ കാണിച്ചു. ഗുണ്ടർട്ട് ശെഖരം നേരിട്ട് കാണാനുള്ള ഭാഗ്യവും കിട്ടി. ലൈബ്രറി ഹെഡ് മരിയാനോ ഡൊർ, ഗബ്രിയേല സെല്ലർ, ഡിജിറ്റൈസേഷൻ ചെയ്യുന്ന നിരവധി പ്രവർത്തകർ എന്നിവരെ ഒക്കെ നേരിട്ട് കാണാൻ പറ്റി. ആ യാത്രയെപറ്റി ഞാൻ അല്പം വിശദമായി ഇവിടെ എഴുതിയിട്ടുണ്ട്. അതിനു പുറമെ ടെക്നിക്കൽ കാര്യങ്ങൾ ക്രോഡീകരിക്കുന്ന ഐടി ടീമുമായും എനിക്ക് മീറ്റിങും ഉണ്ടായിരുന്നു. ഇതൊക്കെ കണ്ടതോടെ ആണ് ഈ പദ്ധതിൽ ട്യൂബിങ്ങൻകാർ പദ്ധതിയിൽ നമ്മുടെ സേവനം എത്രയധികം ആഗ്രഹിക്കുന്നു എന്നത് എനിക്കു മനസ്സിലായത്.
ഈ യാത്ര കൊണ്ട് പദ്ധതിയിലെ ആളുകൾ തമ്മിൽ കൂടുതൽ വ്യക്തിബന്ധം ഉണ്ടാക്കാനും പദ്ധതി എങ്ങനെ മുൻപോട്ട് കൊണ്ടു പോകണം എന്നതിനെ പറ്റി കൂടുതൽ ധാരണയും ആയി.
വിക്കി പ്ലാറ്റ്ഫോമിന്റെ തെരഞ്ഞെടുപ്പ്
എന്റെ ട്യൂബിങ്ങൻ യാത്രയിൽ ഐടി ടീമുമായി നടന്ന ചർച്ചയിലെ പ്രധാന ഇനം ഏത് പ്ലാറ്റ് ഫോമിലൂടെ യൂണിക്കോഡ് കൺവേർഷൻ നടത്തും എന്നതായിരുന്നു. മലയാളം വിക്കിമീഡിയ പദ്ധതികളിലെ അനുഭവജ്ഞാനം കൊണ്ട് മീഡിയ വിക്കി തന്നെയാണ് ഞാൻ നിർദ്ദേശിച്ചത്. ഈ പദ്ധതിയുടെ ആദ്യകാലത്ത് എന്നോടുത്തുണ്ടായിരുന്ന എല്ലാവർക്കും മീഡിയാവിക്കി ഉപയോഗിക്കാൻ അറിയും എന്നതും ഇങ്ങനെയൊരു തീരുമാനത്തിന്നു എന്നെ പ്രേരിപ്പിച്ചു.
വിക്കിഗ്രന്ഥശാലയിൽ സ്കാനുകൾ അപ്ലൊഡ് ചെയ്ത് പ്രൊജക്ട് അവിടെ എക്സിക്യൂട്ട് ചെയ്യാനാണ് ആദ്യം ആലൊചിച്ചത്. ആ വിധത്തിൽ ചെയ്താൽ പദ്ധതിയുടെ മേൽ ട്യുബിങ്ങനോ എനിക്കോ യാതൊരു നിയന്ത്രണവും ഉണ്ടാവില്ല എന്നതിനാൽ ആ നിർദേശം ആദ്യം തന്നെ തള്ളപ്പെട്ടു. മാത്രമല്ല 26,000 താളുകൾ സമയബന്ധിതമായി ഗ്രന്ഥശാലയിലെ സമൂഹത്തെ ഉപയോഗിച്ച് തീർക്കാൻ പറ്റില്ല എന്നത് എനിക്കു ഉറപ്പുമായിരുന്നു.
അങ്ങനെ ആണ് ആദ്യം എന്റെ ബ്ലോഗിനു കീഴിൽ ഒരു പ്രൈവറ്റ് വിക്കിയും പിന്നിട് ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റി തന്നെ ഗുണ്ടർട്ട് വിക്കിയും സെറ്റപ്പ് ചെയ്യുന്നതിലേക്കു നയിച്ചത്.
മീഡിയാവിക്കി പ്ലാറ്റ്ഫോം യൂണിക്കോഡ് കണ്വേർഷനു തിരഞ്ഞെടുത്തത് ഈ പദ്ധതിയുടെ വിജയത്തെ നിർണ്ണയിച്ച ഒരു പ്രധാനഘടകമായിരുന്നു. അതില്ലായിരുന്നു എങ്കിൽ ഇത്ര നന്നായി യൂണിക്കോഡ് കൺവേർഷൻ നടക്കുമായിരുന്നില്ല.
എന്റെ ബ്ലോഗിനു കീഴിലുള്ള പ്രൈവറ്റ് വിക്കിയിലെ അഭ്യാസങ്ങൾ
2016 അവസാനത്തോടെ സ്കാനുകൾ എത്തി തുടങ്ങി. ആദ്യം എന്റെ ബ്ലോഗിന്റെ കീഴിൽ ഒരു പ്രൈവറ്റ് വിക്കി സ്ഥാപിച്ച് അതിലാണ് ആദ്യത്തെ കുറച്ചു പുസ്തകങ്ങൾ യൂണിക്കോഡാക്കിയത്. ഇതിനായി ഒത്തുകൂടിയത് എനിക്കു വ്യക്തിപരമായി പരിചയമുള്ള കുറച്ചു സന്നദ്ധപ്രവർത്തകർ ആയിരുന്നു. മലയാളം വിക്കിപീഡിയ, വിക്കിഗ്രന്ഥശാല, ഇന്ത്യൻ വിക്കിമീഡിയ പരിപാടികൾ, പൊതുസഞ്ചയരേഖകൾ ഡിജിറ്റൈസ് ചെയ്ത് പങ്കുവെക്കുന്നതിലൂടെ ഒക്കെ എന്നെ വിശ്വസിച്ച ഒരു കൂട്ടം സന്നദ്ധപ്രവർത്തകർ മാത്രമായിരുന്നു അത്. അക്കാലത്ത് എനിക്കു നേരിട്ട് അറിയാത്ത ആരും ഇതിൽ ഉണ്ടായിരുന്നതും ഇല്ല.
എന്റെ ബ്ലോഗിനു കീഴിൽ സ്ഥാപിച്ച പ്രൈവറ്റ് വിക്കിയിലൂടെ ഏതാണ്ട് ഏഴോളം പുസ്തകങ്ങൾ ഞങ്ങൾ കുറച്ചു പേർ ചെർന്ന് യൂണിക്കോഡാക്കി. ഗുണ്ടർട്ടിന്റെ മലയാളഭാഷാ വ്യാകരണം, വജ്രസൂചി, തുടങ്ങി പല പുസ്തകങ്ങളും ഇത്തരത്തിൽ എന്റെ പ്രൈവറ്റ് വിക്കിയിലൂടെ യൂണിക്കോഡാക്കിയതിൽ പെടുന്നു. ഇതിനു ആവശ്യമായ സാങ്കേതികസഹായങ്ങൾ മിക്കവാറും ഒക്കെ തന്നത് സന്നദ്ധപ്രവർത്തകൻ ആയ ജുനൈദ് പി.വി. ആണ്. പക്ഷെ ഇത്രകുറച്ചു പുസ്തകങ്ങളിൽ ആയിരത്തോളം പേജുകൾ ചെയ്തു കഴിഞ്ഞപ്പോൾ തന്നെ ഞങ്ങളുടെ എല്ലാവരുടേയും അടപ്പിളകി. അതിന്റെ ഒപ്പം എന്റെ പ്രൈവറ്റ് വിക്കി പ്രശ്നങ്ങളും കാണിക്കാൻ തുടങ്ങി. ഈ വിധത്തിൽ പദ്ധതി മുൻപോട്ട് പോയാൽ ഏതാണ്ട് 5000ത്തിൽ പരം ലിത്തോഗ്രഫിക്ക് താളുകളും 3500ൽ പരം ഡബിൾ കോളം നിഘണ്ടുഉള്ളടക്കം വരുന്ന താളുകളും ഒക്കെ അടങ്ങുന്ന 26,000ത്തോളം താളുകൾ ഞങ്ങൾക്കു കൈകാര്യം ചെയ്യാൻ ആവില്ല എന്നു ബോദ്ധ്യമായി. അതിനാൽ അടുത്ത പരിഹാരം തേടി.
ഗുണ്ടർട്ട് വിക്കി സ്ഥാപിക്കുന്നു
തുടർന്ന് ട്യൂബിങ്ങൻ അധികൃതരുമായി ചർച്ച ചെയ്ത് ടെക്നിക്കൽ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റി തന്നെ ഒരു വിക്കിസ്ഥാപിച്ച് പദ്ധതി അവിടെ നടത്താൻ നിശ്ചയിച്ചു.
അങ്ങനെ 2017 മാർച്ചോടെ ഗുണ്ടർട്ട് വിക്കി എന്ന പേരിൽ യൂണിക്കോഡ് കൺവേർഷനു വേണ്ടി ഒരു പ്രൈവറ്റ് വിക്കി ട്യൂബിങ്ങൻ യൂണിവെഴ്സിറ്റി സ്ഥാപിച്ചു. എന്റെ വിക്കിയിൽ ഇതിനകം ചെയ്ത ആയിരത്തോളം പെജുകളിലെ ഉള്ളടക്കം ഗുണ്ടർട്ട് വിക്കിയിലെക്ക് മൈഗ്രേറ്റ് ചെയ്യുന്ന പണി ആണ് ആദ്യം ചെയ്തത്. ഇതിനു വേണ്ട സാങ്കേതികസഹായം ചെയ്തു തന്നത് ജുനൈദും ബെഞ്ചമിൻ വർഗ്ഗീസും ആണ്. മൈഗ്രേഷൻ പണി ഭൂരിപക്ഷവും അനൂപ് നാരായണൻ ആണ് ചെയ്തത്. ഗുണ്ടർട്ട് വിക്കി സ്ഥാപിച്ച് അവിടെ പണി തുടങ്ങിയതോടെ ടെക്നിക്കൽ പ്രശ്നങ്ങൾ ഒരു പരിധി വരെ തീർന്നെങ്കിലും നിലവിൽ ഉള്ള എനിക്കു വ്യക്തിപരമായി അറിയുന്ന കുറച്ചു സന്നദ്ധപ്രവർത്തകരെ വെച്ച് പദ്ധതി മുന്നോട്ടു നീങ്ങില്ല എന്നു വ്യക്തമായി.
പദ്ധതിയിലേക്ക് കൂടുതൽ അംഗങ്ങൾ വരുന്നു
ഈ വിഷമം ഹൈക്കയും എലീനയുമായി ചർച്ച ചെയ്തു. ഒരു പബ്ലിക്ക് അപ്പീൽ നടത്തി പദ്ധതിയിലേക്ക് കൂടുതൽ ആളുകളെ ക്ഷണിക്കുക എന്ന പരിഹാരം ആണ് ഉരുത്തിരിഞ്ഞത്. അങ്ങനെ പദ്ധതിയിലേക്ക് താല്പര്യമുള്ള കൂടുതൽ ആളുകളെ ക്ഷണിച്ചു കൊണ്ടുള്ള ഒരു പോസ്റ്റ് ഞാൻ 2017 ജൂലൈയിൽ ഇട്ടു. അത് ഇവിടെ കാണാം. പദ്ധതിയിലെ ഭൂരിപക്ഷം പേരും ഈ അഭ്യർത്ഥന മാനിച്ച് പദ്ധതിയുടെ ഭാഗമായവർ ആണ്. എല്ലാവരും പദ്ധതിയുടെ പ്രാധാന്യം മനസ്സിലാക്കി മാത്രം പദ്ധതിയിലേക്ക് വന്നവരാണ്.
പദ്ധതിയിലേക്ക് അംഗങ്ങളെ തെരഞ്ഞെടുത്ത വിധം
ഇതിനു മുൻപ് സൂചിപ്പിച്ച പോലെ, എനിക്കു നേരിട്ടു അറിയുന്നവരും മലയാളം ടൈപ്പിങ്, വിക്കി എഡിറ്റിങ് എന്നിവയിൽ വിദഗ്ദർ ആയവർ മാത്രമായിരുന്നു തുടക്കത്തിൽ പദ്ധതിയുടെ ഭാഗം ആയത്. അവർക്ക് എല്ലാവർക്കും കാര്യങ്ങൾ അറിയാം എന്നത് കൊണ്ട് അവർക്കു പ്രത്യേകം തെരഞ്ഞെടുപ്പ് വേണ്ടി വന്നില്ല. എന്നാൽ പബ്ലിക്ക് അപ്പീലിലൂടെ കൂടുതൽ ആളുകൾ വന്നപ്പോൾ അവരെ തെരഞ്ഞെടുക്കേണ്ടതിനായി ഞാൻ സ്വീകരിച്ച വഴി താഴെ പറയുന്നതാണ്.
താല്പര്യം കാണിച്ചവർക്ക് ശെഖരത്തിലെ ചില പ്രധാനപുസ്തകങ്ങളുടെ 3 താളുകൾ വീതം അയച്ചു. ഇത് കിട്ടിയതോടെ പദ്ധതിയിൽ ശരിക്കും പ്രവർത്തിക്കാൻ താല്പര്യമുള്ളവർ കുറച്ച് കഷ്ടപ്പെട്ടിട്ട് ആണെങ്കിലും അത് ടൈപ്പ് ചെയ്ത് എനിക്കു തിരിച്ചയച്ചു. ഇതിൽ കുറച്ചു പേർ ആദ്യമായാണ് മലയാളം ടൈപ്പിങ് പോലും ചെയ്തത്. സ്കാൻ കണ്ടൂ പേടിച്ചു പോയ ചിലർ മറുപടി പോലും അയച്ചില്ല. ടൈപ്പ് ചെയ്ത് തിരിച്ച് അയച്ച സംഗതി എല്ലാം ഓക്കെയാണെങ്കിൽ അവരെ നേരിട്ടു ഗുണ്ടർട്ട് വിക്കിയിലേക്ക് സ്വാഗതം ചെയ്തു. താല്പര്യമുണ്ട് എന്നാൽ ടൈപ്പിങിൽ പ്രശ്നമുണ്ട് എന്ന കാണുന്നവർക്ക് ഞാൻ ആദ്യം ടൈപ്പിങ് പരിശീലനം/വിക്കി എഡിറ്റിങ് പരിശീലനം കൊടുത്തു. അവർ അത്യാവശ്യം പ്രൊഫിഷ്യന്റ് ആയ ശേഷം അവരേയും ഗുണ്ടർട്ട് വിക്കിയിലേക്ക് ചേർത്തു. ഇതിനു വേണ്ടി ബാംഗ്ലൂരിൽ എന്റെ വീട്ടിൽ വന്നവർ ഉണ്ട്, വീഡിയോ കോൺഫറസിൽ കൂടെ കാര്യങ്ങൾ മനസ്സിലാക്കിയവർ ഉണ്ട്, ഞാൻ കേരളത്തിൽ പോയപ്പോൾ നേരിട്ടു വന്നുകണ്ടു കാര്യങ്ങൾ പഠിച്ചവരുണ്ട്.
വെറും 7-8 ആളുകളുമായി മുടന്തി നീങ്ങിയിരുന്ന പദ്ധതിയിലേക്ക് 40നടുത്ത് ആളുകൾ എത്തി. കൂടുതൽ ആളുകൾ വന്നതോടെ പദ്ധതി സജീവമായി. ഈ ആളുകളുടെ എല്ലാം സൂക്ഷ്മവിവരങ്ങൾ ഗുണ്ടർട്ട് പോർട്ടലിൽ ഡോക്കുമെന്റ് ചെയ്തിട്ടൂണ്ട്. അത് ഇവിടെ കാണാം.
സാങ്കേതിക പരിഹാരങ്ങൾ
ആദ്യം കിട്ടിയ കുറച്ചു പുസ്തകങ്ങൾ എളുപ്പമായിരുന്നു. എന്നാൽ രേഖകളുടെ പഴക്കം കൂടും തൊറും കാര്യങ്ങൾ ബുദ്ധിമുട്ടായി തുടങ്ങി. ഇന്നു നിലവില്ലാത്ത കൂട്ടക്ഷരങ്ങൾ, പഴയ ചില്ലുകൾ, ചില്ലുകൂട്ടക്ഷരങ്ങൾ, പഴയ ൟ, തീയതി ചിഹ്നം, മലയാള അക്കങ്ങൾ, മലയാള ഭിന്നസംഖ്യകൾ, പഴയ മലയാളമെഴുത്തിൽ ഉപയോഗിച്ചിരുന്ന സവിശെഷ ചിഹ്നങ്ങൾ ഇതിന്റെ ഒക്കെ ധാരാളിത്തം എല്ലാവരേയും കഷ്ടത്തിലാക്കി. ആദ്യം കുറേ കാലം ഓരോന്നായി കോപ്പി പേസ്റ്റ് ചെയ്താണ് ഇത് ഉള്ളടക്കത്തിൽ ഉൾപ്പെടുത്തിയത്.
എന്നാൽ ധാരാളമായി ഇതുവരാൻ തുടങ്ങിയപ്പോൾ പദ്ധതിയുടെ ടെക്നിക്കൽ സപ്പോർട്ടർ ആയ ഫ്ലോറിയാൻ വാഗ്നർ ടൈപ്പിങിനു എളുപ്പത്തിനായി ഈ അപൂർവ്വചിഹ്നങ്ങൾ മിക്കതും വിക്കിയുടെ എഡിറ്റിങ് ടൂൾ ബാറിലേക്ക് ഇന്റഗ്രേറ്റ് ചെയ്തു. ആവശ്യമുള്ള ചിഹ്നത്തിൽ ഞെക്കിയാൽ അത് ഉള്ളടക്കത്തിലെക്ക് ഇൻസെർട്ട് ആവും എന്നതിനാൽ പിന്നെ ഈ ചിഹ്നങ്ങൾ എളുപ്പം കൈകാര്യം ചെയ്യാം എന്ന നിലയിലായി. ആ ടൂൾ ബാറിന്റെ ഒരു ഭാഗം താഴെ ചിത്രത്തിൽ.
പദ്ധതിയുടെ സാങ്കേതിക വശങ്ങൾ – TEI: Text Encoding Initiative
ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റി, TEI: Text Encoding Initiative എന്ന സംഘടന അനുശാസിക്കുന്ന ഡിജിറ്റൽ ആർക്കൈവിങ് ടാഗുകൾ ആണ് യൂണിക്കോഡ് ടെസ്റ്റ് അടുക്കി പെറുക്കാൻ ഉപയോഗിച്ചത്. അക്കാദമിക്ക് സർക്കിളിലും ഡാറ്റയെ ഡിജിറ്റൽ ആക്കി കൈകാര്യം ചെയ്യാൻ ഉദ്ദേശിക്കുന്ന കൂട്ടായ്മകൾക്ക് ഇടയിലും, പ്രചാരമുള്ള ടെസ്റ്റ് എൻകോഡിങ് രീതി ആണ് TEI. അതിനെ പറ്റി കൂടുതൽ അറിയാൻ ആഗ്രഹമുള്ളവർ http://www.tei-c.org ഈ ലിങ്കിൽ പോയി കാര്യങ്ങൾ മനസ്സിലാക്കുക. കുറച്ചു വിവരങ്ങൾ ഇവിടെയും കാണാം https://en.wikipedia.org/wiki/Text_Encoding_Initiative
യൂണിവെഴ്സിറ്റി ഞങ്ങളോട് ഈ രീതി ഉപയോഗിക്കാൻ പറഞ്ഞപ്പോൾ ഇത് എന്താണെന്ന് പോലും ഞങ്ങൾക്ക് അറിയുമായിരുന്നില്ല. പിന്നെ വായിച്ചു മനസ്സിലാക്കിയെടുത്തു. യൂണിവെഴ്സിറ്റി തന്നെ ഇതിന്റെ ടാഗുകൾ ഉപയോഗിക്കുവാൻ ഉള്ള സംഗതി ടൂൾ ബാറിൽ ചേർത്ത് ഞങ്ങളെ സഹായിക്കുകയും ചെയ്തു.
ഇപ്പോൾ ഈ പദ്ധതി കഴിഞ്ഞ സ്ഥിതിക്കു പറയട്ടെ വിക്കിഗ്രന്ഥശാല അടക്കം പഴയ ഉള്ളടക്കത്തെ അതെ പോലെ റീപ്രൊഡ്യൂസ് ചെയ്യുന്ന പദ്ധതികൾ TEI ടാഗുകൾ ഉപയോഗിച്ച് സ്കാനിനെ അതെ പോലെ റീപ്രൊഡ്യൂസ് ചെയ്യുക ആണ് വേണ്ടതെന്ന് എന്റെ അഭിപ്രായം. ഗ്രന്ഥശാലയിൽ നിലവിൽ ഫോർമാറ്റിങിനു പ്രാധാന്യം കൊടുക്കുന്നൂണ്ട്. ഉള്ളടക്കം പുനരുപയൊഗിക്കാൻ ഇത് തടസ്സമാണ്. വെറും ടെസ്റ്റ് മാത്രമായി കിട്ടുന്ന്താണ് ഉള്ളടക്കത്തിന്റെ പുനരുപയോഗത്തിനു എളുപ്പം. നിലവിൽ ഗ്രന്ഥശാലയിൽ അനുവർത്തിക്കുന്ന രീതി പുനരുപയോഗം എന്ന ഡിജിറ്റൽ ആർക്കൈവിങിന്റെ ഉദ്ദേശം പൂർണ്ണമായി നിറവേറ്റുന്നതല്ല.
ടൈപ്പിങ് പ്രതിസന്ധികൾ
പദ്ധതി തുടങ്ങി ഉള്ളടക്കത്തിലേക്ക് ഊളിയിടാൻ തുടങ്ങിയപ്പോൾ നിരവധി പ്രതിസന്ധികൾ ഉണ്ടായി. ചിലത് എടുത്ത് പറയുന്നു:
- ഇന്നത്തെ തലമുറയിലെ മലയാളികൾക്ക് 19-ാം നുറ്റാണ്ടിലെ എഴുത്തുരീതിയും ശൈലിയും മറ്റും അറിയുമായിരുന്നില്ല. അതിനാൽ സ്കാനിൽ ഉള്ളതല്ല ടൈപ്പ് ചെയ്യുന്നത് എന്ന സ്ഥിതി പലവട്ടം ഉണ്ടായി.
- പഴയരീതിയിലുള്ള മലയാള അക്കങ്ങളോ പഴയ എഴുത്തിന്റെ സവിശെഷതയായ ചിഹ്നങ്ങളോ ഒന്നും മിക്കവർക്കും അറിയുമായിരുന്നില്ല.
- ലിത്തോഗ്രഫി അച്ചടി കൈയെഴുത്ത് തന്നെയായിരുന്നാൽ അത് കുരുക്കഴിച്ച് വായിച്ചെടുക്കുന്നത് വലിയ കടമ്പ ആയിരുന്നു.
- അച്ചടി ആയിരുന്നിട്ടു പോലും ഡബിൾ കോളത്തിലുള്ള നിഘണ്ടുക്കളുടെ യൂണിക്കോഡ് കൺവേർഷൻ വലിയ പണി ആയിരുന്നു.
- ബെഞ്ചമിൻ ബെയിലിയും ഗുണ്ടർട്ടും അവരുടെ നിഘണ്ടുക്കളിൽ ധാരാളം ലാറ്റിൻ സ്പെഷ്യൽ ക്യാരക്ടറുകൾ ഉപയോഗിച്ചിരുന്നു. യൂണിക്കോഡ് ചാർട്ട് തപ്പി ഈ ക്യാരക്ടറുകൾ തപ്പിയെടുക്കാൻ ഞങ്ങൾ വളരെ ബുദ്ധിമുട്ടി.
- ഉള്ളടക്കം അതേ പോലെ റീപ്രൊഡ്യൂസ് ചെയ്യുക എന്നതായിരുന്നു യൂണിവെഴ്സിറ്റിയുടെ നിർദ്ദേശം എന്നതിനാൽ സ്കാനിലെ ഉള്ളടക്കം അതെ പോലെ ആക്കുന്നത് പ്രശ്നമായിരുന്നു.നിലവിലെ യൂണിക്കോഡ് എഴുത്തു പൂർണ്ണമായി പഴയ എഴുത്തു രീതിയെ സപ്പോർട്ട് ചെയ്യുന്ന വിധത്തിൽ ആയിട്ടില്ല എന്നതാണ് അതിനു കാരണം.
സ്റ്റൈൽ ഗൈഡ് നിർമ്മാണം
പദ്ധതി തുടങ്ങിയപ്പോൾ തന്നെ ഓരോ പ്രവർത്തകനും ടൈപ്പ് ചെയ്തത് റിവ്യൂ ചെയ്യുമ്പോൾ മാനകീകരണം ഇല്ലാത്തത് വലിയ പ്രശ്നമായി കണ്ടു. ഒരേ കാര്യം തന്നെ പലർ ടൈപ്പ് ചെയ്യുമ്പോൾ പല രീതിയിൽ ആകുന്നത് പദ്ധതിയുടെ ഗുണനിലവാരത്തെ ബാധിച്ചു. ഈ പ്രതിസന്ധിയെ മറികടക്കാൻ പദ്ധതിക്കായി സ്റ്റൈൽ ഗൈഡ് നിർമ്മിച്ചു. എല്ലാവരും അത് വായിച്ച് പഠിച്ചു അതിൽ പറയുന്ന പോലെയേ ടൈപ്പ് ചെയ്യാവൂ എന്ന് നിർദ്ദേശിച്ചു. പദ്ധതിയുടെ പ്രാധാന്യമറിയാവുന്ന അംഗങ്ങൾ എല്ലാം തന്നെ അത് വായിച്ചു നിർദ്ദെശങ്ങൾ പിന്തുടരാൻ തുടങ്ങിയതോടെ യൂണീക്കോഡിൽ കൺവേർഷനിൽ ഉണ്ടായിരുന്ന പ്രശ്നങ്ങൾ ഒഴിവായി. താഴെ ചിത്രത്തിൽ ഈ സ്റ്റൈൽ ഗൈഡിൽ കവർ ചെയ്ത വിവിധ വിഷയങ്ങളുടെ ചെറിയ ഒരു ഭാഗം ഇവിടെ കാണാം.
മെയിലിങ് ലിസ്റ്റ്
പദ്ധതിയുടെ തുടക്കത്തിൽ എല്ലാവർക്കും എല്ലാകാര്യത്തിലും സംശയങ്ങൾ ആയിരുന്നു. സംശയം തീർക്കാനായി എല്ലാവരും എനിക്കു മെയിലയക്കുക ആയിരുന്നു ആദ്യം ചെയ്തിരിക്കുന്നത്. പല ചോദ്യങ്ങളുടേയും ഉത്തരം എനിക്കു അറിയുമായിരുന്നില്ല. അത്തരം സംഗതികൾ ഞാൻ സുനിൽ വി.എസുമായി ചർച്ച ചെയ്ത് ഉത്തരം കണ്ടെത്തുകയായിരുന്നു. സ്റ്റൈൽ ഗൈഡ് കുറേയഗിധം ആവർത്തനചൊദ്യങ്ങൾ ഒഴിവാക്കി എങ്കിലും പിന്നെയും ധാരാളം സംശയങ്ങൾ വന്നുകൊണ്ടേ ഇരുന്നു. പക്ഷെ ഇത്തരം നൂറുകണക്കിനു മെയിലുകൾ എന്റെ വളരെയധികം സമയം അപഹരിച്ചു. അവസാനം പദ്ധതിക്കായി ഗൂഗിൾ ഗ്രൂപ്പിൽ ഒരു മെയിലിങ് ലിസ്റ്റ് ഉണ്ടാക്കി. തുടർന്ന് അംഗങ്ങൾ മെയിലുകൾ എനിക്കു അയക്കുന്നതിനു പകരം മെയിലിങ് ലിസ്റ്റിലേക്ക് അയക്കാൻ തുടങ്ങി. അംഗങ്ങളുടെ അത്ര നാളത്തെ പ്രവർത്തിപരിചയം കൊണ്ട് പല ചൊദ്യങ്ങൾക്കും ഉത്തരം അറിയുന്ന ആരെങ്കിലും ഉണ്ടാവും എന്നതിനാൽ ഉത്തരങ്ങൾ മെയിലിങ് ലിസ്റ്റിൽ തന്നെ പൊതുവായി ലഭ്യമായി തുടങ്ങി. ആർക്കും ഉത്തരം നൽകാനാത്ത ചൊദ്യങ്ങൾ മാത്രമേ പിന്നീട് എനിക്കും സുനിലിനും കൈകാര്യം ചെയ്യേണ്ടി വന്നുള്ളൂ. അംഗങ്ങളെ പദ്ധതിയുടെ ഉടമസ്ഥാവകാശത്തിലേക്ക് കൊണ്ടു വരാൻ ഈ നീക്കത്തിനു കഴിഞ്ഞു.
കഴിഞ്ഞ 1.5 വർഷം കൊണ്ട് ഈ മെയിലിങ് ലിസ്റ്റിൽ കൈകാര്യം ചെയ്ത മെയിലുകൾ ക്രോഡീകരിച്ചാൽ തന്നെ അത് പദ്ധതിയുടെ ചരിത്രവും മലയാളം എഴുത്തിന്റെ പരിണാമവും കൂടെ ആവും രേഖപ്പെടുത്തുക.
അംഗങ്ങൾക്ക് പുസ്തകങ്ങൾ വിഭജിച്ചു നൽകിയതിനെ പറ്റി
പദ്ധതിയുടെ തുടക്കത്തിൽ പദ്ധതിയിലെ അംഗങ്ങൾക്ക് ഒരാൾക്ക് ഒരു പുസ്തകം എന്ന രീതിയിൽ ആണ് വിഭജിച്ച് നൽകിയത്. പക്ഷെ എല്ലാവരും വളരെ പെട്ടെന്ന് തന്നെ ഈ രീതിയെ വെറുത്തു. ഒരേ വിഷയം തന്നെ കൈകാര്യം ചെയ്യുമ്പോൾ ഉണ്ടാകുന്ന മടുപ്പ്, ധാരാളം പേജുകൾ ഉള്ള രേഖകൾ ചെയ്യുമ്പോൾ ഉണ്ടാകുന്ന മടുപ്പ് തുടങ്ങി പല കാരണങ്ങളും ഇതിനുണ്ട്. ഇതുമൂലം പല പുസ്തകങ്ങളും മാസങ്ങൾ കഴിഞ്ഞിട്ടും തീരില്ല എന്ന നിലവന്നു. ഈ പ്രശ്നം തുടക്കത്തിൽ തന്നെ കണ്ടെത്തിയതിനാൽ ഒരു പുസ്തകം മൊത്തം ഒരാൾക്ക് കൊടുക്കുന്ന പരിപാടി തുടക്കത്തിലെ നിർത്തി. അതിനു പകരം ഓരോത്തർക്കും പല വിഷയങ്ങളിൽ ഉള്ള പുസ്തകങ്ങൾ എടുത്ത് അതിലെ പേജുകൾ വിഭജിച്ചു കൊടുക്കുക ആണ് ചെയ്തത്. ഇതോടുകൂടെ അംഗങ്ങൾക്ക് അവർക്കു തീർക്കാവുന്ന പേജുകളേ ഓരോ പുസ്തകത്തിലും ഉള്ളൂ എന്നതിനാൽ ഓരോ പുസ്തകവും പെട്ടെന്ന് തീർന്നു. വിവിധ വിഷയങ്ങൾ കൈകാര്യം ചെയ്യുന്നതിനാൽ അംഗങ്ങൾക്ക് ആസ്വദിച്ച് പദ്ധതിയിൽ പങ്കെടുക്കാനും പറ്റി.
സ്ഥിതിവിവരക്കണക്കുകൾ
136 പുസ്തകങ്ങളിലെ 25,700ൽ പരം പേജുകൾ ആണ് ഞങ്ങൾ യൂണിക്കോഡ് കൺവേർഷൻ പദ്ധതിയിൽ കൈകാര്യം ചെയ്തത്. ഇതിൽ ഏതാണ്ട് 1,700ഓളം താളുകൾ ബ്ലാങ്ക് പേജുകളോ യൂണിക്കോഡ് ഉള്ളടക്കം ഇല്ലാത്ത ചിത്രപേജുകളോ ആയിരുന്നു. അത് ഒഴിച്ചു നിർത്തിയാൽ ഏകദേശം 24,000 താളുകൾ ആണ് ഞങ്ങൾ ടൈപ്പ് ചെയ്ത് മലയാളം യൂണിക്കോഡ് ആക്കിയത്.
അംഗങ്ങളായി പ്രവർത്തിച്ചവരിൽ സ്കൂൾകൂട്ടി പ്രായത്തിലുള്ളവർ തൊട്ട് മദ്ധ്യവയസ്കർ വരെ ഉണ്ടായിരുന്നു. എല്ലാവരും അവരുടെ വ്യക്തിപരമായ ജോലി സമയം കഴിഞ്ഞിട്ടാണ് പദ്ധതിക്കായി സമയം കണ്ടെത്തിയത്. അംഗങ്ങളിൽ സ്കൂൾ കൂട്ടികൾ, സ്വകാര്യകമ്പനി ഉദ്യോഗസ്ഥർ, സർക്കാർ ഉദ്യോഗസ്ഥർ, സ്വന്തമായി ബിസിനസ്സ് ചെയ്യുന്നവർ, കലാകാരന്മാർ തുടങ്ങി എല്ലാ തലത്തിലുമുള്ള ആളുകൾ ഉണ്ടായിരുന്നു.
കേരളത്തിനകത്ത്, ഇന്ത്യയിൽ കേരളത്തിനു വെളിയിൽ, ഗൾഫ് രാജ്യങ്ങൾ, അമേരിക്ക, യൂറോപ്പ് തുടങ്ങി ലോകത്തിന്റെ മിക്കവാറും എല്ലാ ഭാഗങ്ങളിൽ നിന്നുമുള്ള മലയാളികൾ പദ്ധതിയിൽ പങ്കെടുത്തു. (ആഫ്രിക്കയിൽ നിന്നും ആസ്ട്രേലിയയിൽ നിന്നും ഓരോരുത്തർ ഉണ്ടായിരുന്നു എല്ലാ ഭൂഖണ്ഡങ്ങളിൽ നിന്നും പങ്കെടുത്തു എന്നു പറയാമായിരുന്നു ? )
രേഖകളുടെ പൊതുസ്വഭാവം
മലയാളത്തിലെ ആദ്യകാല അച്ചടി രേഖകളിലെ ഭൂരിപക്ഷവും ഈ പദ്ധതിയിലൂടെ ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ട് പൊതു ഇടത്തിൽ എത്തി. ചില പ്രധാന രേഖകൾ താഴെ പറയുന്നു:
- 1829 – പുതിയ നിയമം – പുതിയനിയമം ആദ്യമായി മലയാളത്തിലേക്ക് പരിഭാഷപ്പെടുത്തി അച്ചടിച്ചത്
- 1842 ഗീതങ്ങൾ മംഗലാപുരത്തെ ലിത്തോഗ്രഫി പ്രസ്സിൽ നിന്ന് പുറത്തിറങ്ങിയ ആദ്യ മലയാളപുസ്തകം
- 1846 ബെയിലിയുടെ മലയാളം – ഇംഗ്ലീഷ് നിഘണ്ടു – അച്ചടിച്ച ആദ്യ മലയാളം-ഇംഗ്ലീഷ് നിഘണ്ടു
- 1849 ബെഞ്ചമിൻ ബെയ്ലിയുടെ ഇംഗ്ലീഷ് മലയാളം നിഘണ്ടു – അച്ചടിച്ച ആദ്യ ഇംഗ്ലീഷ് മലയാളം നിഘണ്ടു
- 1851 – മലയാള ഭാഷാ വ്യാകരണം – ഗുണ്ടർട്ടിന്റെ വ്യാകരണഗ്രന്ഥം
- 1858 വിദ്യാമൂലങ്ങൾ – ചിത്രങ്ങളുമായി വന്ന ആദ്യ മലയാളവൈജ്ഞാനികപുസ്തകം
- 1860 മൃഗചരിതം – കളർ ചിത്രങ്ങളുമായി വന്ന ആദ്യ മലയാളവൈജ്ഞാനികപുസ്തകം
- 1866 തൊട്ട് 1885 വരെയുള്ള കാലഘട്ടത്തിലെ പത്തോളം മലയാള പഞ്ചാംഗങ്ങൾ
- 1877 തൊട്ട് 1882 വരെയുള്ള കാലഘട്ടത്തിൽ ഇറങ്ങിയ കേരളോപകാരി മാസികയുടെ നിരവധി ലക്കങ്ങൾ
- 1882 ശരീരശാസ്ത്രം – ലീബെൻദർ സായിപ്പ് പുറത്തിറക്കിയ മലയാളത്തിലെ ആദ്യത്തെ ശരീരശാസ്ത്രഗ്രന്ഥം
- 1883 പ്രകൃതിശാസ്ത്രം – ഫ്രോൺമെയർ സായിപ്പ് പുറത്തിറക്കിയ ആദ്യത്തെ ഫിസിക്സ് ഗ്രന്ഥം
തുടങ്ങി നിരവധി ആദ്യകാല മലയാള അച്ചടി പുസ്തകങ്ങൾ ഞങ്ങൾ യൂണിക്കോഡാക്കി.
ലെറ്റർ പ്രസ്സിൽ അച്ചടിച്ച 100 പുസ്തകങ്ങൾ ആണ് മലയാളം യൂണിക്കോഡ് ആക്കിയത്. അതിനു പുറമെ 36 കല്ലച്ചടി പുസ്തകങ്ങളും യൂണിക്കോഡ് ആക്കി. യൂണീക്കോഡിൽ ആക്കിയ 136 അച്ചടി പുസ്തകങ്ങൾ പുറമെ യൂണിക്കോഡിൽ ആക്കാത്ത 28 അച്ചടി പുസ്തകങ്ങളും 74 കൈയെഴുത്ത് രെഖകളും 22 താളിയോല രെഖകളും ഈ ശേഖരത്തിൽ ഡിജിറ്റൈസ് ചെയ്തിട്ടൂണ്ട്.
ഇതിൽ ചില പുസ്തകങ്ങളെ കുറിച്ച് ഡോ: സ്കറിയ സക്കറിയയെ പോലുള്ള ചിലർ ആധുനിക കാലത്ത് പഠനം നടത്തിയിട്ടുണ്ടെങ്കിലും ഭൂരിപക്ഷം അച്ചടിപുസ്തകങ്ങളും കൈയെഴുത്ത് പ്രതികളും താളിയോലഗ്രന്ഥങ്ങളും ധാരാളം ഗവേഷണവിഷയങ്ങൾ ഉൾക്കൊള്ളുന്നു. അത് ആരൊക്കെ പ്രയോജനപ്പെടുത്തും എന്നത് കാത്തിരുന്നു കാണാം.
യൂണിക്കോഡ് കൺവേർഷനിൽ പങ്കെടുത്ത അംഗങ്ങളുടെ അഭിപ്രായങ്ങൾ
യൂണിക്കോഡ് കൺവേർഷനിൽ പങ്കെടുത്ത എല്ലാവരോടും അനുഭവക്കുറിപ്പ് പങ്കു വെക്കണം എന്ന് അഭ്യർത്ഥിച്ചു എങ്കിലും വളരെ കുറച്ചു പേർ മാത്രമേ അതിനു തയ്യാറായുള്ളൂ. തയ്യാറായവരുടെ അനുഭവക്കുറിപ്പിലേക്കുള്ള ലിങ്കുകൾ താഴെ:
- സുനിൽ കുമാർ
- രാജേഷ് ഒടയഞ്ചാൽ
- അബ്ദുൾ ലത്തീഫ്
- ആർ പി ശിവകുമാർ
- മനോജ് എബനേസർ
- നൗഫൽ മുബാറക്ക് (ഇക്കാസ്)
- ജിബു വർഗ്ഗീസ്
ഗുണ്ടർട്ട് ശേഖരത്തിന്റെ സ്കാനുകളുടെ പ്രാധാന്യം
സ്കാൻ പൊതുഇടത്തിലേക്ക് വന്നത് ഏറ്റവും കൂടുതൽ ഉപയോഗപ്പെടുത്തേണ്ടത് ഗവേഷകരാണ്.
സജീവ ഗവെഷകരോ അക്കാദമിക്ക് പശ്ചാത്തലത്തിൽ നിന്നോ അല്ലാത്ത ഞങ്ങൾക്ക് (സിബു, സുനിൽ, ഷിജു) 2 ഗവേഷണപ്രബന്ധങ്ങൾ ഈ രെഖകളെ ഉപയോഗിച്ച പ്രസിദ്ധീകരിക്കാൻ കഴിഞ്ഞു. ആദ്യത്തേത് 2013ൽ പുറത്തുവന്ന ചന്ദ്രക്കല: ഉത്ഭവവും പ്രയോഗവും എന്ന പ്രബന്ധം, രണ്ടാമത്തെത് 2018ൽ പുറത്തു വന്ന മുണ്ടക്കയം – മലയാള അച്ചടിയിലെ അറിയപ്പെടാത്ത ചരിത്രം എന്ന പ്രബന്ധം. അക്കാദമിക്ക് പശ്ചാത്തലത്തിൽ നിന്നല്ലാത്ത ഞങ്ങൾ ഉപരിപ്ലവമായി ഈ രേഖകളെ നോക്കിയിട്ടുപോലും ഇത്ര കണ്ടെടുക്കാൻ പറ്റിയെങ്കിൽ സജീവഗവേഷകർക്ക് എത്രയധികം കഴിയണം? സജീവ ഗവേഷകർ ഈ രേഖകളെ പ്രയോജനപ്പെടുത്തി മികച്ചഫലങ്ങളെ പുറപ്പെടുവിക്കും എന്ന് പ്രത്യാശിക്കുന്നു.
ഈ ശേഖരത്തിലെ അച്ചടി പുസ്തകങ്ങൾ മാത്രമേ കുറച്ചെങ്കിലും ഗവേഷണങ്ങൾക്ക് പാത്രമായിട്ടുള്ളൂ. 75ൽ പരം കൈയെഴുത്തുപ്രതികളും 25ഓളം താളിയോലശേഖരവും അധികം വിശകലനം ചെയ്തിട്ടില്ല. അതൊക്കെ ജനുവിൻ ഗവേഷകർക്ക് അക്ഷയഖനിയാണ്.
പത്രപ്രവർത്തകർ, സ്വന്തന്ത്രഗവെഷകർ തുടങ്ങിയവർക്കും വിവിധ ലെഖനങ്ങൾ തയ്യാറാക്കാൻ ഈ സ്കാനുകൾ പ്രയോജനപ്പെടും.
വിക്കിഗ്രന്ഥശാല, സായാഹ്ന തുടങ്ങിയ സന്നദ്ധപ്രവർത്തക സംഘങ്ങൾക്കും ഈ സ്കാനുകൾ വളരെ പ്രയോജനം ചെയ്യുന്നതാണ്.
യൂണിക്കോഡ് പതിപ്പിന്റെ ഗുണങ്ങൾ
സ്കാൻ ചെയ്തെടുക്കുന്ന രേഖകൾ മലയാളം യൂണികോഡിലേക്ക് ആക്കി സൂക്ഷിക്കേണ്ടതിന്റെ പ്രാധാന്യം എല്ലാവർക്കും അറിയാമല്ലോ. മലയാളം വിക്കിഗ്രന്ഥശാല എന്ന വികീഡിയ ഫൗണ്ടെഷൻ പദ്ധതിയുടെ ഉദ്ദേശം തന്നെ മലയാളം രേഖകളുടെ സ്കാനുകളിൽ നിന്ന് യൂണികോഡ് പതിപ്പ് ഉണ്ടാക്കി സൂക്ഷിക്കുക എന്നതാണ്.
ഗുണ്ടർട്ട് ലെഗസി പദ്ധതിയിലെ സ്കാനുകൾ പദ്ധതിക്കു പുറത്ത് ആദ്യമായി ഉപയോഗപ്പെടുത്തിയതും മലയാളം വിക്കിസംരംഭങ്ങൾ ആണ്. പുറത്ത് വന്ന സ്കാനുകളിലെ അച്ചടി പുസ്തകങ്ങൾ എല്ലാം ഇതിനകം വിക്കിമീഡിയ കോമൺസിലേക്ക് അപ്ലോഡ് ചെയ്തു കഴിഞ്ഞു. അതിനു പുറമെ യൂണിക്കോഡിൽ ആക്കിയ ഉള്ളടക്കം ആദ്യമായി ഉപയോഗപ്പെടുത്തിയതും മലയാളം വിക്കിഗ്രന്ഥശാല ആണ്. യൂണിക്കോഡിൽ ആക്കിയ 136 പുസ്തകങ്ങളിലെ 25,700 ഓളം താളുകൾ ആണ് ഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്തത്. പ്രൂഫ് റീഡ് ഒക്കെ ചെയ്ത് മുകച്ചനിലവാരത്തിലുള്ള ഈ ഉള്ളടക്കം ഗ്രന്ഥശാലയിലെ മൊത്തം ഉള്ളടക്കത്തിന്റെ നിലവാരം വളരെയധികം വർദ്ധിപ്പിക്കും,
യൂണിക്കോഡ് ഉള്ളടക്കം ഉപയോഗിച്ച് ഈ ഗ്രന്ഥങ്ങൾ എല്ലാം നവീന അച്ചടി സങ്കേതങ്ങൾ ഉപയോഗിച്ച് അച്ചടിച്ച് പുനഃപ്രസിദ്ധീകരിക്കാനും ഓഡിയോ പുസ്തകങ്ങൾ അടക്കമുള്ളവ ഉണ്ടാക്കാനും ഉള്ള സാദ്ധ്യതയാണ് വേറൊരു പ്രധാന പുനരുപയോഗ മേഖല.
ഗുണ്ടർട്ട് ലെഗസി പദ്ധതിയിലെ രേഖകളിലൂടെ ഞങ്ങൾക്ക് പഴയമലയാളത്തിൽ ഉപയോഗിച്ചിരുന്ന കുറേയധികം അക്ഷരങ്ങളേയും ചിഹ്നങ്ങളേയും കണ്ടെടുക്കാൻ കഴിഞ്ഞു. അതിൽ പലതും യൂണിക്കോഡ് എൻകോഡ് ചെയ്യാൻ പ്രൊപ്പോസൽ കൊടുത്തു കഴിഞ്ഞു. ചിലതൊക്കെ യൂണിക്കോഡിന്റെ പത്താം പതിപ്പിൽ വന്നു കഴിഞ്ഞു. വേറെ ചിലത് പിറകാലെ വരുന്നു. ഭിന്നസംഖ്യകൾ, ചില്ലുകൂട്ടക്ഷരങ്ങൾ തുടങ്ങിയ പലതും ഗുണ്ടർട്ട് രേഖകളിൽ നിന്ന് കണ്ടെടുത്തതും ഇനി യൂണിക്കോഡിൽ രേഖപ്പെടുത്തി വരെണ്ടതും ആണ്. ഗുണ്ടർട്ട് രേഖകൾ ആധാരമാക്കി കൊടുത്ത ചില പ്രപ്പോസലുകൾ താഴെ പറയുന്നതാണ്.
- Proposal to encode MALAYALAM SIGN CIRCULAR VIRAMA – https://unicode.org/L2/L2014/14014r-circular-virama.pdf
- Proposal to encode MALAYALAM SIGN VERTICAL VIRAMA- https://unicode.org/L2/L2014/14015r-vertical-virama.pdf
- Request to Annotate North Indian Quarter Signs for Malayalam Usage –https://www.unicode.org/L2/L2017/17340-malayalam-usage.pdf
പുരാതനരേഖകൾ തപ്പുമ്പോൾ കിട്ടുന്ന പഴയ ചിഹ്നങ്ങൾ ഈ വിധത്തിൽ രേഖപ്പെടുത്തുന്നത്, ഫോണ്ട് നിർമ്മാതാക്കളേയും ഇൻപുട്ട് ടൂളുകൾ ഉണ്ടാക്കുന്നവരേയും അവരുടെ സംഗതികൾ പുതുക്കേണ്ട സ്ഥിതിയിലേക്ക് നയിക്കും. ലിപിമാറ്റരീതിയിൽ മലയാളം ടൈപ്പ് ചെയ്യുന്നതിൽ ഇത്തരം മാറ്റങ്ങൾ വരുത്താൻ താരതമ്യേനെ എളുപ്പമാണെങ്കിലും ഇൻക്സ്രിപ്റ്റ് പോലെ പുതുക്കാൻ പ്രയാസമായ നിവേശകരീതി ഉപയോഗിക്കുന്നവർക്ക് ഇതു പ്രശ്നങ്ങളും സൃഷ്ടിക്കുന്നൂണ്ട്.
പുരാതനരേഖകളിൽ നിന്നു ചിഹ്നങ്ങൾ കിട്ടുന്നു, ആ ചിഹ്നങ്ങൾ ഫോണ്ടിൽ രേഖപ്പെടുത്തുന്നു. ഇൻപുട്ട് ടൂൾ നിർമ്മാതാക്കൾ ടൂൾ അപ്ഡെറ്റ് ചെയ്യുന്നു, അതുപയോഗിച്ച് ആളുകൾ പുരാതനരേഖകൾ യൂണിക്കോഡ് ആക്കുകയും ചെയ്യുന്നു. ഈ വിധതിൽ ഇതെല്ലാം പരസ്പര പൂരകങ്ങളാണ്.
സ്കാനിലെ വരിയും ഉള്ളടക്കവും അതേ പോലെ മാച്ച് ചെയ്ത് പ്രൂഫ് റീഡ് ചെയ്ത് ഉണ്ടാക്കിയിരിക്കുന്നതാണ് 24,000ത്തോളം താളുകളിലെ ഉള്ളടക്കം. അതിൽ ഏതാണ്ട് 18,000ത്തോളം താളുകൾ ലെറ്റർ പ്രസ്സ് അച്ചടി പുസ്തകങ്ങൾ ആണ്. ഈ താളുകൾ മലയാളത്തിന്നായി നല്ല ഒരു ഒ.സി.ആർ എഞ്ചിൻ വികസിപ്പിക്കാനുള്ള മികച്ച ഉപാധി ആണ്. അതുമായി ബന്ധപ്പെട്ടവർ ഇത് ഉപയോഗപ്പെടുത്തുമെന്ന് കരുതുന്നു. ഏതാണ്ട് 5000ത്തിൽ പരം ലിത്തോഗ്രഫിക്ക് താളുകളും ഇതേ പോലെ സ്കാനിലെ വരിയും ഉള്ളടക്കവും അതെ പോലെ മാച്ച് ചെയ്ത് പ്രൂഫ് റീഡ് ചെയ്ത് ഉണ്ടാക്കിയിരിക്കുന്നതാണ്. ഇതുപയോഗിച്ച് ഒ.സി. ആർ സോഫ്റ്റ്വെയറിനെ ട്രെയിൻ ചെയ്താൽ ലെറ്റർ പ്രസ്സിന്റെ അത്ര അക്യുറസി വരില്ലെങ്കിലും മലയാളം കൈയെഴുത്ത് വായിക്കാനാവുന്ന ഒരു നല്ല ഒ.സി.ആർ എഞ്ചിന്റെ ഡെവലപ്പ്മെന്റിലേക്കാണ് അത് നയിക്കുക എന്നു തോന്നുന്നു.
ഇതിനൊക്കെ അപ്പുറം ഈ പുസ്തകങ്ങളിലെ ഉള്ളടക്കം വെബ്ബ് സേർച്ചിലൂടെ ലഭ്യമാകും എന്നത് പരമപ്രധാനമാണ് ആരൊക്കെ ഏതൊക്കെ വിധത്തിൽ ഉപയോഗപ്പെടുത്തും എന്നത് നമുക്ക് കാത്തിരുന്ന് കാണേണ്ടതാണ്.
കാഴ്ചയ്ക്ക് പ്രശ്നമുള്ള ഗവേഷകർക്കും മറ്റുള്ളവർക്കും ഒരു സവിശെഷവരദാനമാണ് ഈ യൂണിക്കോഡ് പതിപ്പ്. അവർക്ക് ഈ രേഖകൾ e-Speak പോലുള്ള സോഫ്റ്റ്വെയർ ഉപയൊഗിച്ച് വായിച്ചു കേൾക്കാം. അതിൽ നിന്ന് മികച്ച ഫലങ്ങൾ ഉണ്ടാക്കാൻ അവർക്കും കഴിയും.
ഗുണ്ടർട്ട് പോർട്ടൽ
2018 ജനുവരിയിലാണ് പദ്ധതിയുടെ ഭാഗമായി ഗുണ്ടർട്ട് പോർട്ടൽ എന്ന പ്രത്യെക സൈറ്റ് ഒരുക്കാൻ യൂണിവേഴ്സിറ്റി പദ്ധതി ഇടുന്നു എന്ന ഹൈക്കെ എന്നെ അറിയിക്കുന്നത്. പദ്ധതിയുമായി ബന്ധപ്പെട്ട എല്ലാ സംഗതികളും ഒരിടത്ത് ലഭിക്കും എന്നത് കൊണ്ട് ഇത് പ്രധാനപ്പെട്ട ഒരു സംഗതിയായി എനിക്ക് തോന്നി. അതിന്റെ ഔട്ട്പുട്ട് കണ്ടപ്പോൾ അത് ബോദ്ധ്യമാവുകയും ചെയ്തു. ഗുണ്ടർട്ട് പോർട്ടൽ 2018 നവംബർ 20നു റിലീസ് ചെയ്തു.
നേരത്തെ സൂചിപ്പിച്ച പോലെ മലയാളം മാത്രമല്ല ഗുണ്ടർട്ട് ലെഗസി പദ്ധതിയിലൂടെ ഡിജിറ്റൈസ് ചെയ്തത്. താഴെ പറയുന്നതാണ് ഡിജിറ്റൈസ് ചെയ്ത രെഖകളുടെ വിശദാംശങ്ങൾ:
- മലയാളം – 293 പൊതുസഞ്ചയ രേഖകൾ
- കന്നഡ – 187 പൊതുസഞ്ചയ രേഖകൾ
- തമിഴ് – 32 പൊതുസഞ്ചയ രേഖകൾ
- തെലുഗു – 5 പൊതുസഞ്ചയ രേഖകൾ
- തുളു – 5 പൊതുസഞ്ചയ രേഖകൾ
- സംസ്കൃതം – 30 പൊതുസഞ്ചയരേഖകൾ
- ജർമ്മൻ– 250 പൊതുസഞ്ചയ രേഖകൾ
- ഇംഗ്ലീഷ് – 170 പൊതുസഞ്ചയ രേഖകൾ
ഈ എല്ലാഭാഷകളും ചേർത്ത് 849 പൊതുസഞ്ചയ രേഖകളൂം അതിൽ 1,37,148 താളുകളും ആണുള്ളത്. അതാണിപ്പോൾ സ്കാൻ ചെയ്ത് ഗുണ്ടർട്ട് പോർട്ടലിലൂടെ ലഭ്യമാക്കിയിരിക്കുന്നത്.
പക്ഷെ ഇതിൽ മലയാളം രേഖകൾ മാത്രമേ യൂണിക്കോഡ് ആക്കിയിട്ടുള്ളൂ. മലയാളശെഖരത്തിലെ അച്ചടി പുസ്തകങ്ങളിൽ(ലെറ്റർ പ്രസ്സ് അച്ചടിയും ലിത്തോഗ്രഫിക്ക് അച്ചടിയും) 136 എണ്ണമാണ് യൂണിക്കോഡ് ആക്കിയത്. ഈ 136 പുസ്തകങ്ങളിൽ ഏതാണ്ട് 25,700താളുകൾ ആണ് ഉള്ളത്. അതിൽ 1,700 ഓളം താളുകൾ ബ്ലാങ്ക് പേജുകളോ ചിത്രതാളുകൾ ആണുള്ളത്. അതൊഴിച്ച് നിർത്തിയാൽ 24,000 താളുകൾ ആണ് മലയാളം യൂണിക്കോഡ് ആക്കിയത്.
ഗുണ്ടർട്ട് പോർട്ടലിനെ (http://gundert-portal.de) പരിചയപ്പെടുത്തി കൊണ്ട് ഒരു ലഘുകുറിപ്പ് ഞാൻ എഴുതിയിട്ടൂണ്ട്. വിശദാംശങ്ങൾക്ക് ഈ ബോഗ്പോസ്റ്റ് കാണുക.
പദ്ധതിയുമായി ബന്ധപ്പെട്ട ചില കാര്യങ്ങൾ യൂണിവെഴ്സിറ്റി തന്നെ സൈറ്റിൽ ഡോക്കുമെന്റ് ചെയ്തിട്ടുണ്ട്. അതിൽ ചിലത്:
- പദ്ധതിയെ പറ്റിയുള്ള പൊതുവിവരം.
- സ്ഥിതിവിവരക്കണക്കുകൾ
- പദ്ധതിയുടെ ഭാഗമായവരെ കുറിച്ചുള്ള വിവരം
- നന്ദി
- രേഖകൾ ഭാഷയനുസരിച്ച്
- രേഖകൾ തരം അനുസരിച്ച്
കൂടുതൽ വിവരത്തിനു ഗുണ്ടർട്ട് പോർട്ടൽ (https://www.gundert-portal.de) സന്ദർശിക്കുക.
വിക്കിഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേഷൻ
ട്യൂബിങ്ങന്റെ ഡിജിറ്റൽ ലൈബ്രറിയിൽ യൂണിക്കോഡ് ഉള്ളടക്കം ലഭ്യമാണെങ്കിലും, അതു കൂടുതൽ ഇടങ്ങളിൽ പുനരുപയോഗിക്കുമ്പോഴാണ് 40ൽ അധികം പ്രവർത്തകർ നടത്തിയ പ്രയത്നത്തിനു പൂർണ്ണഫലം ഉണ്ടാകൂ. ഇതിനായി ഞങ്ങൾ ആദ്യം തിരഞ്ഞെടുത്തത് മലയാളം വിക്കിഗ്രന്ഥശാല ആണ്. ഉള്ളടക്കം ഗ്രന്ഥശാലയിൽ എത്തികഴിഞ്ഞാൽ പുനരുപയോഗം കുറച്ചുകൂടി എളുപ്പമാകും എന്നതുകൊണ്ട് കൂടാണിത്.
ഇതിനു ആദ്യമായി വേണ്ടി വന്നത് അച്ചടിപുസ്തകങ്ങളുടെ (പ്രധാനമായും യൂണിക്കോഡ് കൺവേർഷൻ കഴിഞ്ഞ 136 പുസ്തകങ്ങൾ) സ്കാനുകൾ വിക്കിമീഡിയ കോമൺസിൽ അപ്ലോഡ് ചെയ്യുക എന്നതായിരുന്നു. എല്ലാ സ്കാനുകളും സൈസ് വളരെ കൂടുതൽ ആയിരുന്നതിനാൽ ഈ പണി തീരാൻ ആഴ്ചകൾ എടുത്തു. പ്രധാനമായും റോജി പാല, ശ്രീജിത്ത് ടി.കെ., റസിമാൻ എന്നിവർ ആണ് ഈ ഡൗൺലൊഡ് അപ്ലോഡ് പരിപാടി ചെയ്തത്. അവർക്കു നന്ദി.
സ്കാനുകൾ കോമൺസിലേക്ക് എത്തിയതോടെ യൂണിക്കോഡ് ഉള്ളടക്കം ഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്യാനുള്ള പദ്ധതി തുടങ്ങി. ഈ പദ്ധതിക്ക് ചുക്കാൻ പിടിച്ചത് ഗുണ്ടർട്ട് ലെഗസി പദ്ധതിയിൽ കാതലായ പല ടെക്നിക്കൽ പരിഹാരങ്ങളും ചെയ്തു തന്ന ജുനൈദാണ് പി.വി ആണ്. ജുനൈദ് ഉള്ളടക്കം മൈഗ്രേറ്റ് ചെയ്യാനുള്ള പ്ലാറ്റ്ഫോം ഒരുക്കിയതോടെ മൈഗ്രേഷനു വേണ്ടിയുള്ള സ്ക്രിപ്റ്റ് റസിമാൻ എഴുതി. ബോട്ടോടിച്ച് ഉള്ളടക്കം ഗ്രന്ഥശാലയിലേക്ക് മാറ്റിയത് റസിമാൻ, സുനിൽ വി.എസ്., അനൂപ് നാരായണൻ എന്നിവർ ചേർന്നാണ്. അതിൽ തന്നെ റസിമാൻ ആണ് ഭൂരിപക്ഷം പണികളും ചെയ്തത്. വിക്കി ബോട്ട് ആയിട്ടു പോലും 136 പുസ്തകങ്ങളിലെ 25,700 ഓളം പേജുകൾ വിക്കിഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്തു തീരനായി ഏകദേശം 2 ദിവസത്തെ പ്രയത്നം വേണ്ടി വന്നു. ഗ്രന്ഥശാലയിലേക്ക് മൈഗ്രേറ്റ് ചെയ്തത് എല്ലാം കൂടെ ഇവിടെ നിന്നു ആക്സെസ് ചെയ്യാം.
ഉള്ളടക്കം വിക്കിഗ്രന്ഥശാലയിൽ എത്തിയതോടെ താല്പര്യമുള്ളവർ അത് പുനരുപയോഗിക്കും എന്ന് കരുതട്ടെ. ഗുണ്ടർട്ട് നിഘണ്ടുവും ബെയിലി നിഘണ്ടുവും അടക്കം നാലു നിഘണ്ടുക്കളിലെ ഉള്ളടക്കം സമർത്ഥമായി പുനരുപയോഗിച്ചാൽ തന്നെ മലയാളം കമ്പ്യൂട്ടിങ്ങുമായി ബന്ധപ്പെട്ട വിവിധ സംഗതികൾക്ക് ഉപകാരമാകും. യൂണിക്കോഡ് ഉള്ളടക്കം ആരൊക്കെ എങ്ങനെയൊക്കെ പുനരുപയോഗിക്കും എന്നത് കാണാൻ ആകാംക്ഷയോടെ കാത്തിരിക്കുന്നു.
ഉള്ളടക്കം വിക്കിഗ്രന്ഥശാലയിൽ എത്തിയതോടെ 5 വർഷങ്ങൾക്ക് മുൻപ് ഒരു മെയിലിൽ നടത്തിയ അഭ്യർത്ഥനയുടെ ബാക്കി പത്രമായി വളർന്ന ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി ഔദ്യോഗികമായി തീർന്നു. ഇനി ഇത് ഉപയോഗിക്കുന്നവർ ആണ് അതുനന്നായി ഉപയോഗിച്ച് പദ്ധതിയുമായി ബന്ധപ്പെട്ടവരുടെ പ്രയത്നങ്ങൾക്ക് നന്ദി പറയേണ്ടത്.
https://archive.org/ലെ പതിപ്പ്
കാൾ മൽമൂദിന്റെ സഹായത്തോടു കൂടെ രേഖകൾ മിക്കതും https://archive.orgൽ എത്തിച്ചിട്ടൂണ്ട്.
ഞാൻ പഠിച്ച പാഠങ്ങൾ
ഈ പദ്ധതി എന്നെ പഠിപ്പിച്ച പാഠങ്ങൾ നിരവധിയുണ്ട്. ഏറ്റവും പ്രധാനപാഠം ലക്ഷ്യബോധമുള്ള കുറച്ചു സന്നദ്ധപ്രവർത്തകർ ഒന്നിച്ചാൽ ഏത് സങ്കീർണ്ണപദ്ധതിയും തീർക്കാൻ എളുപ്പമാണ് എന്നതാണത്.
വലിയ ഒരു പദ്ധതി നടത്താൻ ഉദ്ദേശമുണ്ടെങ്കിൽ ആ പദ്ധതിയുടെ എല്ലാ വിവരങ്ങളും ആദ്യമേ അറിയാതിരിക്കുക എന്നത് പ്രധാനമാണെന്ന് ഈ പദ്ധതിയിലൂടെ എനിക്കു മനസ്സിലായി. കൂടുതൽ കാര്യങ്ങൾ മനസ്സിലായാൽ പദ്ധതി തന്നെ നടക്കാതിരിക്കാനുള്ള സാദ്ധ്യതയിലേക്കാണ് അത് പോവുക. സമാനമായ ഒരു പദ്ധതി ഉടൻ നടത്താൻ പറഞ്ഞാൽ ഞാൻ നിലവിലെ സ്ഥിതിയിൽ ഏറ്റെടുക്കില്ല. കാരണം ഈ ഒരെണ്ണം മാനേജ് ചെയ്തതോടെ ഇതിൽ ഉൾപ്പെട്ട കടമ്പകൾ എല്ലാം എനിക്കറിയാം. ?
ഈ പദ്ധതി തുടങ്ങിയപ്പോഴും, നടന്നു കൊണ്ട് ഇരിക്കുമ്പൊഴും പലവിധ കാരണങ്ങൾ പറഞ്ഞ് എന്നെ നിരുത്സാഹപ്പെടുത്തിയവർ ഉണ്ട്. ട്യൂബിങ്ങൻ എന്നെ ഉപയോഗിച്ച് അവരുടെ പദ്ധതി ഓടിക്കുകയാണ്, അവസാനം പണി തരും എന്നു പറഞ്ഞവർ ഉണ്ട്. എന്നെ സംബന്ധിച്ചിടത്തോളം അവിടെ ഇരിക്കുന്ന രേഖകൾ ഡിജിറ്റൈസ് ചെയ്ത് പൊതുഇടത്തിലേക്ക് കൊണ്ടുവരിക എന്നതായിരുന്നു പ്രധാനം. എനിക്കു ട്യൂബിങ്ങനേയും, അവർക്കു എന്റെ സേവനവും ആവശ്യമായിരുന്നു. അത് രണ്ടും പ്രൊഫഷണലായി തന്നെ നടന്നു. പദ്ധതി അതിന്റെ പൂർണ്ണലക്ഷ്യം നേടിയതോടെ സംശയം പ്രകടിപ്പിച്ചവർ ഒക്കെ തെറ്റാണെന്ന് തെളിയിക്കാൻ കഴിഞ്ഞു. സ്കാനുകൾ വിക്കിമീഡിയ കോമൺസിലും യൂണിക്കോഡ് ഉള്ളടക്കം ഗ്രന്ഥശാലയിലും കൂടെ എത്തിയതോടെ എല്ലാം അർത്ഥത്തിലും പുനരുപയോഗം കൂടുതൽ തലത്തിലേക്ക് എത്താനുള്ള സാദ്ധ്യതയും ആയി. പരസ്പരബഹുമാനത്തൊടെ പ്രൊഫഷണലായി ഈ പദ്ധതി നടത്തിയ ഹൈക്കയോടും ഗബ്രിയേലയോടും എനിക്കു തീർത്താൽ തീരാത്ത കടപ്പാടുണ്ട്.
ഈ പദ്ധതിക്കു മുന്നേറാനുള്ള ഓരോ വഴിയും ദുർഘടങ്ങൾ വരുന്ന മുറയ്ക്ക് ഞങ്ങൾ വെട്ടി എടുക്കുക ആയിരുന്നു.
ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി ഒന്നോ രണ്ടോ പേരുടെ പദ്ധതി ആയിരുന്നില്ല. ലോകത്തിലെ വിവിധ രാജ്യങ്ങളിൽ ഇരുന്ന് വിവിധ ഭാഷക്കാരായ നിരവധി ആളുകൾ നടത്തിയ കൂട്ടായ്മയുടെ ഫലം ആണത്. അത് നന്നായി പര്യവസാനിച്ചു എന്ന് കാണുന്നത് വളരെ സന്തോഷം ഉണ്ട്.
നന്ദി, കടപ്പാട്
പദ്ധതി പ്രൊപ്പോസ് ചെയ്യുന്നതിൽ ചെറിയൊരു റോൾ എനിക്കുണ്ടെങ്കിലും ഇപ്പോൾ ഗുണ്ടർട്ട് ലെഗസി പദ്ധതി പൂർത്തിയായി സ്കാനുകളും യൂണിക്കോഡ് പതിപ്പും എല്ലാം എല്ലാവർക്കും എപ്പോഴും ആക്സെസ് ചെയ്യാവുന്ന വിധത്തിൽ പുറത്ത് എത്തിയതിൽ ഏറ്റവും വലിയ പങ്കു വഹിച്ചിരിക്കുന്നത് ഹൈക്കെ ഒബർലിൻ (മോസർ) ആണ്. പദ്ധതി പ്രൊപ്പൊസ് ചെയ്ത 2012-2013 കാലഘട്ടത്തിൽ ആ അഭ്യർത്ഥ്യനയുടെ എല്ലാ പ്രാധാന്യവും തിരിച്ചറിഞ്ഞ അവർ ആ വിഷയം ലൈബ്രറിയുമായി ബന്ധപ്പെട്ട എല്ലാവരുമായും ചർച്ച ചെയ്യാനും, പദ്ധതിക്കു ഫണ്ടിങ്ങിനായുള്ള അഭ്യർത്ഥന തയ്യാറാക്കാനും, യൂണിക്കോഡ് കൺവേർഷനുള്ള സാദ്ധ്യത ഞാനുമായി ആരായാനും, സ്കൂൾ കുട്ടികളെ പങ്കെടുപ്പിക്കാനുള്ള സാദ്ധ്യത തേടി കേരളത്തിൽ പലരേയും കാണാൻ യാത്രകൾ നടത്തിയും, യൂണിക്കോഡ് കൺവേർഷനിൽ പ്രതിസന്ധികൾ ഉണ്ടായപ്പോൾ പരിഹാരം തരാനും, അങ്ങനെ പദ്ധതിയിൽ എപ്പൊഴും ഹൈക്കെ ഒബർലിൻ ഉണ്ടായിരുന്നു. അവരൊടു ഈ രേഖകൾ ഉപയോഗപ്പെടുത്താൻ പോകുന്ന എല്ലാവരും നന്ദിയുള്ളവർ ആയിരിക്കണം എന്നാണ് ഞാൻ പറയുക. ഹൈക്കെ ഒബർലിനെ പോലെ ഒരാൾ ട്യൂബിങ്ങനിൽ ഇല്ലായിരുന്നു എങ്കിൽ ഈ പദ്ധതി നടക്കുമായിരുന്നില്ല. എനിക്കു വ്യക്തിപരമായി അവരൊടു തീർത്താൽ തീരാത്ത നന്ദിയും കടപ്പാടുണ്ട്.
ഹൈക്കയോട് ഒപ്പം തന്നെ നന്ദി പറയേണ്ട ആളാണ് ഗബ്രിയേല സെല്ലർ. ഗുണ്ടർട്ട് ലെഗസി പ്രൊജക്ടിന്റെ പ്രൊജക്ട് മാനേജർ ഗബ്രിയേല സെല്ലർ ആണ്. ഡിജിറ്റൈസ് ചെയ്യാനുള്ള രേഖകളുടെ കാറ്റലോഗ് തയ്യാറാക്കുന്നത്, സ്കാൻ ചെയ്യാനുള്ള പദ്ധതി തയ്യാറാക്കിയത് തൊട്ട് ഇങ്ങേ അറ്റം ഗുണ്ടർട്ട് പോർട്ടലിന്റെ റിലീസ് വരെയും അവരുടെ മേൽനോട്ടം എല്ലായിടത്തും ഉണ്ടായിരുന്നു. എല്ലാ സേവനത്തിന്നും നന്ദിയും കടപ്പാടും.
ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റി ഹെഡായ മരിയാന ഡൊറിനോടും നമുക്ക് കടപ്പാടുണ്ട്. അവർ മുൻപോട്ട് പോകാൻ അനുമതിയും ആവശ്യമായ മാർഗ്ഗനിർദ്ദേശങ്ങളും കൊടുത്തില്ലായിരുന്നു എങ്കിൽ ഇങ്ങനെ ഒരു പദ്ധതി തന്നെ ഉണ്ടാവുമായിരുന്നില്ല.
യൂണീക്കോഡ് കൺവേർഷൻ തുടങ്ങിയതിനു ശേഷം യൂണിവേഴ്സിറ്റിയും, യൂണിക്കോഡ് കൺവേർഷൻ ചെയ്യുന്ന അംഗങ്ങളുമായുള്ള കാര്യങ്ങൾ എല്ലാം കോർഡിനേറ്റ് ചെയ്തിരുന്നത് എലീന മുച്ചർലി ആയിരുന്നു. അത് മികച്ച രീതിയിൽ തന്നെ എലീന കൈകാര്യം ചെയ്തു. എലീനയ്ക്കും നന്ദി.
പദ്ധതിക്കു പിന്നിൽ മറഞ്ഞിരുന്നവർ ആയിരുന്നു ട്യൂബിങ്ങനിൽ രേഖകൾ സ്കാൻ ചെയ്ത ഡിജിറ്റൈസേഷൻ സെന്ററിലെ അംഗങ്ങൾ. ഞാൻ എന്റെ ജർമ്മനി യാത്രയിൽ ഈ ടീമിലെ മിക്കവരേയും നേരിട്ടു കണ്ടിട്ടുണ്ടെങ്കിലും ബാക്കിയാരും അവരെ കണ്ടീട്ടില്ല. അവരുടെ പൂർണ്ണവിവരം ഇവിടെ കാണാം. സ്കാനുകൾ ഗുണനിലവാരത്തൊടെ നമ്മൾ ഇന്നു കാണുന്നു എങ്കിൽ അതിനു പിന്നിൽ പ്രയത്നിച്ചതു അവരാണ്. അവർക്ക് പ്രത്യേക നന്ദി.
ടെക്നിക്കൽ സംഗതികൾ എല്ലാം യൂണിവെഴ്സിറ്റിയിലെ ഐടി ടീമംഗമായ ഫ്ലോറിയൻ വാഗ്നർ ആണ് കോർഡിനേറ്റ് ചെയ്തത്. ഗുണ്ടർട്ട് വിക്കിയുടെ വിവിധ പരിഹാരങ്ങൾ തൊട്ട് ഏറ്റവും അവസാനം മലയാളം വിക്കിഗ്രന്ഥശാല മൈഗ്രേഷൻ വരെയും അദ്ദേഹത്തിന്റെ സഹായം ഉണ്ടായിരുന്നു. അദ്ദേഹത്തിന്നും പ്രത്യെക നന്ദി.
പദ്ധതിയുടെ തുടക്കം മുതൽ എനിക്കു എല്ലാ കാര്യത്തിന്നും പിന്തുണയേകിയതും മാർഗ്ഗനിർദ്ദേശങ്ങൾ തന്നതും എന്റെ പ്രിയ സുഹൃത്ത് സുനിൽ വി.എസ്. ആണ്. അദ്ദേഹം സ്വന്തമായി അനുഭവക്കുറിപ്പ് എഴുതിയിട്ടില്ല. വെളിച്ചത്തുവരാതെ പശ്ചാത്തലത്തിൽ നിന്ന് എല്ലാ പിന്തുണയും നൽകുന്ന രീതി ആണ് അദ്ദേഹത്തിന്നു എപ്പോഴും. അദ്ദേഹത്തിന്റെ വിവിധതരത്തിലുള്ള പിന്തുണ ഇല്ലമായിരുന്നു എങ്കിൽ പദ്ധതിയുടെ വിവിധഘട്ടങ്ങൾ എനിക്കു നേരായി മാനേജ് ചെയ്യാൻ പറ്റുമായിരുന്നെന്ന് എനിക്കു തോന്നുന്നില്ല. ആവശ്യമായ മാർഗ്ഗനിർദ്ദേശങ്ങൾ തരുന്നതിനു പുറമേ ഗുണ്ടർട്ട് ശേഖരത്തിലെ വ്യാകരണപുസ്തകങ്ങൾ എല്ലാം സുനിലിന്റെ മേൽ നോട്ടത്തിൽ ആണ് ചെയ്തത്. അതിനു പുറമേ ആണ് രേഖകളിൽ കാണുന്ന സങ്കീർണ്ണപട്ടികകൾ ക്രമപ്പെടുത്താൻ സുനിൽ നൽകിയ സഹായം. സുനിൽ വി.എസിനോടു എനിക്കുള്ള എല്ലാ കടപ്പാടും നന്ദിയും ഇവിടെ രേഖപ്പെടുത്തട്ടെ.
പദ്ധതിയിൽ അല്പം വൈകി ഒരു വർഷത്തിന്നു മുൻപ് മാത്രം ചേർന്ന ആളാണ് റോജി പാല. മുൻകാലത്ത് റോജിയോടൊത്ത് മലയാളം വിക്കിപദ്ധതികളിൽ പ്രവർത്തിച്ചിട്ടൂണ്ടെങ്കിലും എന്തൊക്കെയോ കാരണങ്ങളാൽ ഈ പദ്ധതിയിൽ തുടക്കം തൊട്ട് റോജിയെ ഉൾപ്പെടുത്താൻ പറ്റിയില്ല. റോജി സോഷ്യൽ മീഡിയ ഉപയോഗിക്കുന്നത് കുറവായതു കാരണം പദ്ധതിയെ പറ്റിയുള്ള എന്റെ അറിയിപ്പുകൾ കാണാതിരുന്നതിനാണ് അദ്ദേഹം പദ്ധതിയിൽ വൈകിയെത്താൻ കാരണം. ചേർന്നതിനു ശെഷം ക്രമരഹിതമായി കിടന്നിരുന്ന പലതും ക്രമയപ്പെടുത്തിയത് റോജിയാണ്. ചിലരെങ്കിലും ടൈപ്പിങ് തുടങ്ങി പകുതിയാക്കി മടുത്ത് വഴിയിട്ടിട്ട് പോയി. അതൊക്കെ അടുക്കിപെറുക്കി ഭംഗിയാക്കിയത് റോജിയാണ്. സന്നദ്ധപ്രവർത്തകരിൽ ഏറ്റവും കൂടുതൽ താളുകൾ കൈകാര്യം ചെയ്തതും എറ്റവും കൂടുതൽ എഡിറ്റ് ചെയ്തതും ഒക്കെ റോജിയാണ്. റോജിയുടെ വിക്കിപീഡിയ എഡിറ്റിങ് കണ്ടിട്ടുള്ളത് കൊണ്ട് എനിക്കതിൽ അത്ഭുതമില്ല. റോജിയുടെ പ്രവർത്തനത്തിന്റെ പ്രാധാന്യം ഒറ്റവാക്കിൽ പറയണമെങ്കിൽ, റോജി ഇതൊന്നും ചെയ്യാൻ വന്നില്ലായിരുന്നുവെങ്കിൽ റോജി ചെയ്തതൊക്കെ ഞാൻ ചെയ്യേണ്ടി വന്നേനേ. അല്ലെങ്കിലേ പദ്ധതിയിൽ അമിത ജോലിഭാരം ഉണ്ടായിരുന്ന എനിക്കത് വലിയ ഭാരം ആയേനേ. പദ്ധതിക്ക് വലിയ കൈത്താങ്ങായിരുന്നു റോജിയുടെ സഹായം. റോജിക്കും പ്രത്യേക നന്ദി.
ഇനി നന്ദി പറയേണ്ടത് പദ്ധതിയിൽ എന്നോടൊപ്പം യൂണിക്കോഡ് കൺവേർഷനിൽ പങ്കാളികളായ 40ഓളം പ്രവർത്തകർക്കാണ്. അവരുടെ പേരും വിശദവിഅവരങ്ങളും ഗുണ്ടർട്ട് പൊർട്ടലിൽ ഇവിടെ ലഭ്യമാണ്. ഇതിൽ ചിലർ 10 പേജുകൾ മാത്രം ചെയ്തപ്പോൾ വേറെ ചിലർ 2000 പേജുകൾ വരെ ചെയ്തു. എല്ലാ സംഭാവനയും പ്രാധാന്യമുള്ളത് തന്നെ. അവരുടെ പ്രവർത്തനഫലമാണ് നിങ്ങൾ ലഭിച്ചിരിക്കുന്ന 136 പുസ്തകങ്ങളിലെ 24,000ത്തോളം താളുകളിൽ പരന്നു കിടക്കുന്ന മലയാളം യൂണിക്കോഡ് ഉള്ളടക്കം. വിവിധ സ്റ്റേക്ക് ഹോൾഡറുമാർ എങ്ങനെയൊക്കെ ഉപയോഗിച്ച് വിവിധ ഫലങ്ങൾ ഉണ്ടാക്കും എന്നത് നമുക്ക് കാത്തിരുന്നു കാണാം. എല്ലാവർക്കും എന്റെ നന്ദി.
പദ്ധതിയുമായി ബന്ധപ്പെട്ടു എനിക്കു നേരിട്ടു ഇടപെടേണ്ടി വന്നവരെ മാത്രമാണ് ഇതിൽ പരാമർശിച്ചിരിക്കുന്നത്. ഇതല്ലാതെ വേറെയും ആളുകൾ പദ്ധതിയിൽ പല റോളൂകൾ നിർവ്വഹിച്ചിട്ടൂണ്ട്. അവർക്ക് എല്ലാവർക്കും നന്ദി.
മലയാളത്തിലെ മിക്ക ആദ്യകാല അച്ചടി രേഖകളും ഞങ്ങൾ യൂണിക്കോഡിലാക്കി. അതിൽ ഗുണ്ടർട്ടിന്റെ വ്യാകരണം, ബെയിലി നിഘണ്ടു, പീറ്റിന്റെ വ്യാകരണം, ഇന്ദുലേഖ, പാച്ചുമൂത്തതിന്റെ വ്യാകരണം, ഗുണ്ടർട്ട് നിഘണ്ടു, പശ്ചിമോദയം എന്ന ആദ്യകാല മാസിക, മഹാഭാരതത്തിന്റെ അച്ചടിപതിപ്പ്, ബൈബിളിന്റെ നിരവധി മലയാളപരിഭാഷ പതിപ്പുകൾ, കേരളോപകാരി മാസികയുടെ നിരവധി ലക്കങ്ങൾ തുടങ്ങിയവ ഒക്കെയും അതിൽ ഉൾപ്പെടുന്നു. സ്കാനുകൾ പൊതുഇടത്തിലേക്ക് കൊണ്ടുവന്നതിനു പുറമെ അതിലെ ഭൂരിപക്ഷവും യൂണീക്കോഡ് ആക്കാൻ കഴിഞ്ഞു എന്നത് ഈ പദ്ധതിയുടെ പ്രധാനനേട്ടമായി കരുതാം. ഈ പദ്ധതി സമാനമായ മറ്റു പദ്ധതികൾക്ക് പ്രചോദനം ആകും എന്ന് കരുതട്ടെ.
തന്റെ സ്വകാര്യ ശേഖരത്തിൽ ഉള്ള ഈ മലയാളം രേഖകൾ ഒക്കെ കേരളത്തിൽ നിന്നു തിരിച്ചു പോയപ്പോൾ ഒപ്പം കൊണ്ടു പോകാനും, അത് പിൽക്കാലത്ത് ട്യൂബിങ്ങൻ യൂണിവേഴ്സിറ്റിയിൽ എല്പിക്കാനും സവിശെഷവിവേകം കാണിച്ച ഹെർമ്മൻ ഗുണ്ടർട്ടിനു പ്രണാമം അർപ്പിച്ചു കൊണ്ട് എന്റെ ഈ അനുഭവക്കുറിപ്പ് അവസാനിപ്പിക്കട്ടെ.
ഗുണ്ടർട്ട് ലെഗസി രേഖകളുടെ പട്ടിക
ഗുണ്ടർട്ട് ലെഗസി രേഖകൾ ഈ ബ്ലോഗിലെ നുറുകണക്കിനു പോസ്റ്റുകളിൽ ചിതറികിടപ്പുണ്ട്. പക്ഷെ അത് ഞാൻ ഡിജിറ്റൈസ് ചെയ്യുന്ന മറ്റു രേഖകളുടെ ഒപ്പം ഇടകലർന്നു കിടക്കുന്നതിനാൽ തപ്പിയെടുക്കാൻ ബുദ്ധിമുട്ടാണ്. ആ പ്രശ്നം പരിഹരിക്കാനായി ഗുണ്ടർട്ട് ലെഗസി പുസ്തകങ്ങളുടെ മാത്രം വിവരം ഉൾപ്പെടുത്തി ഞാൻ ഒരു പ്രത്യെക പൊസ്റ്റ് എഴുതിയിട്ടൂണ്ട്. ആ പോസ്റ്റിൽ കൊടുത്തിട്ടുള്ള സ്പ്രെഡ്ഷീറ്റിൽ ഓരോ രേഖയുടേയും ട്യൂബിങ്ങൻ ലൈബ്രറി ലിങ്കും ആർക്കൈവ്.ഓർഗ് ലിങ്കും ലഭ്യമാണ്. ആ ബ്ലൊഗ് പൊസ്റ്റ് ലിങ്ക് ഇതാണ് https://shijualex.in/gundert-legacy-malayalam-list/
You must be logged in to post a comment.