മലയാളപൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷൻ – നിലവിലെ സ്ഥിതിയും സാദ്ധ്യതകളും

കുറഞ്ഞത് 2009 മുതലെങ്കിലും മലയാളപൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷൻ രംഗത്ത് സജീവമായി പ്രവർത്തിക്കുന്നതിനാൽ അത് സംബന്ധിച്ച് നിലവിലെ സ്ഥിതി വിലയിരുത്തകയും സാദ്ധ്യതകൾ എന്തൊക്കെയാണ് എന്ന് വിശദീകരിക്കുകയും ചെയ്യുന്ന ഒരു ചെറിയ ലേഖനം ഞങ്ങൾ (സുനിൽ വി.എസ്, ഷിജു അലക്സ്) ചേർന്ന് എഴുതി. ഈ ലേഖനം ഈയടുത്ത് കേരളപഠന കോൺഗ്രസ്സിന്റെ ഭാഗമായി ചർച്ച ചെയ്തിരുന്നു. ലേഖനത്തിന്റെ ഉള്ളടക്കം എല്ലാവരുമായി പങ്ക് വെക്കുന്നു. പൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷന്റെ പ്രാധാന്യം മനസ്സിലാകുന്നവർക്ക് ഈ ലേഖനത്തിൽ താല്പര്യം ഉണ്ടാകും എന്ന് കരുതുന്നു.

ആമുഖം

സർക്കാർ ഉടമസ്ഥതയിലും സ്വകാര്യവ്യക്തികളുടെ കൈവശവുമായി പൊതുസഞ്ചയത്തിലുള്ള ധാരാളം അമൂല്യരേഖകൾ നമുക്കുണ്ട്. എന്നാൽ നമ്മുടെ നാട്ടിലെ കാലാവസ്ഥയുടെ പ്രത്യേകതകൊണ്ട് ഇത്തരം രേഖകളുടെ ആയുസ്സു കുറവാണ്. അതിനാൽ നശിച്ചുപോകുന്നതിനുമുൻപ് ഇത്തരം രേഖകൾ ഡിജിറ്റൈസ് ചെയ്ത് പഠനങ്ങൾക്കു ലഭ്യമാക്കുകയും ഭാവി ഭാവിതലമുറയ്ക്കുവേണ്ടി സൂക്ഷിക്കുകയും ചെയ്യേണ്ടത് നമ്മുടെ കർത്തവ്യമാണ്.

ഹോർത്തൂസ് മലബാറിക്കസിലെ ഒരു ചിത്രം

ഹോർത്തൂസ് മലബാറിക്കസിലെ ഒരു ചിത്രം

എന്നാൽ പഴയ രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിന്റെ ആവശ്യകതയെന്താണ്? പഴയ രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യേണ്ട ആവശ്യം മുൻപോട്ടു വെക്കുമ്പോൾ അതിനെ വൃഥാപ്രവൃത്തിയായി കരുതുന്ന ധാരാളം പേർ ഇപ്പോഴും ഉണ്ട്. ഉദാഹരണമായി, നിലവിലെ തെളിവനുസരിച്ച് ആദ്യത്തെ മലയാളമച്ചടി പുസ്തകമായി കരുതുന്ന “സംക്ഷേപവെദാർത്ഥത്തിന്റെ” ആദ്യ പതിപ്പ് ഇറങ്ങിയത് 1772ൽ ആണല്ലോ. ഇത് ഡിജിറ്റൈസ് ചെയ്യേണ്ടതിന്റെ ആവശ്യം പറഞ്ഞാൽ ചിലരെങ്കിലും “സംക്ഷേപ വെദാർത്ഥത്തിന്റെ പുതിയ എഡിഷൻ ഇപ്പോഴും ഇറങ്ങുന്നുണ്ടല്ലോ, പിന്നെയെന്തിനു പഴയതു ഡിജിറ്റൈസ് ചെയ്തു സമയം കളയണം” എന്ന മറുപടി ആണു തരിക.

എന്നാൽ ഭാഷയെയും, ലിപിയേയും, സംസ്കാരത്തെയും കുറിച്ചു പഠനം നടത്തുന്നവർക്ക് ഈ രേഖകൾ നിർണായകമാണ്. പഴയ രേഖകൾ ഡിജിറ്റൈസ് ചെയ്താൽ ഉണ്ടാകുന്ന ചില ഗുണഫലങ്ങൾ താഴെപ്പറയുന്നു.

  • ലിപിപരിണാമചരിത്രം പഠിക്കാൻ
  • അച്ചടിപരിണാമചരിത്രം പഠിക്കാൻ
  • ഗദ്യപരിണാമചരിത്രം പഠിക്കാൻ.
  • എഴുത്തുരീതിയുടെ പരിണാമം പഠിക്കാൻ

അങ്ങനെ നിരവധി കാരണങ്ങൾ ചൂണ്ടിക്കാണിക്കാൻ കഴിയും.

ഉദാഹരണത്തിന് സംക്ഷേപവേദാർത്ഥത്തിന്റെ യഥാർത്ഥപതിപ്പിൽ പങ്ച്വേഷൻ ചിഹ്നങ്ങളോ കെട്ടുപുള്ളിയോ വാക്കുകൾക്കിടയിൽ സ്പേസോ ഇല്ലാതെയാണ് പ്രിന്റ് ചെയ്തിരിക്കുന്നത്. എന്നാൽ ഇതിന്റെ പുതിയ പതിപ്പുകളിൽ ഇന്നത്തെപ്പോലെ പങ്ച്വേഷൻ ചിഹ്നങ്ങളും ലിപികളും ഉപയോഗിച്ചിരിക്കുന്നു. അതേ പോലെ ചെറുപൈതങ്ങൾ എന്ന പുസ്തകം റീപ്രിന്റ് ചെയ്തപ്പോൾ പുതിയ ലിയിലാണ് പ്രിന്റ് ചെയ്തത്.   അപ്പോൾ, പതിനെട്ടാം നൂറ്റാണ്ടിലെ മലയാളലിപിയെയും അതിന്റെ അച്ചടിയെയും കുറിച്ച് അറിയാൻ യഥാർത്ഥപതിപ്പുതന്നെ നോക്കണം.

ഭാഷ, ലിപി, സാഹിത്യം മുതലായവയുടെ പഠനത്തിനാണ് ഇത്തരം രേഖകളുടെ പ്രത്യക്ഷോപയോഗം എങ്കിലും പരോക്ഷമായി പഴയകാല കേരളീയരുടെ ജീവിതരീതിയെക്കുറിച്ചും സംസ്കാരത്തെക്കുറിച്ചും ഒക്കെ പഠിക്കാനും ഇത്തരം രേഖകൾ ഉപയോഗപ്പെടുത്താനാകും. ഉദാഹരണത്തിന്, മലയാളലിപി ആദ്യമായി അച്ചടിക്കപ്പെട്ട ഹോർത്തൂസ് മലബാറിക്കസിലെ ചിത്രങ്ങളിലൂടെ അന്നത്തെ ജനങ്ങളുടെ വസ്ത്രധാരണത്തെക്കുറിച്ചുള്ള വിവരങ്ങളും ലഭിക്കുന്നു. അതുപോലെ ആദ്യകാലനോവലായ ഘാതകവധത്തിലെ ചിത്രങ്ങൾ അക്കാലത്തെ കേരളത്തിന്റെ നേർക്കാഴ്ച നൽകുന്നു.

ഇതിലെല്ലാം ഉപരിയായി, രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതുവഴി ഈ മേഖലയിൽ താൽപര്യമുള്ള ഗവേഷകർക്കെല്ലാവർക്കും അവയുടെ പതിപ്പ് ഒരേസമയം റെഫർ ചെയ്യാൻ ലഭ്യമാകുന്നു. ഇങ്ങനെ നിരവധി കാരണങ്ങളാൽ പഴയ രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യേണ്ടതുണ്ട്. അതായത്, പുതിയ പതിപ്പ് ഇറങ്ങുന്നുണ്ട് എന്നത് പഴയ പതിപ്പ് ഡിജിറ്റൈസ് ചെയ്യാ‍തിരിക്കാൻ കാരണമല്ല.

മലയാള പൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷൻ –  നിലവിലെ സ്ഥിതി

മലയാളപൊതുസഞ്ചയ രേഖകളിൽ കുറച്ചൊക്കെ ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ടിട്ടുണ്ട്. എന്നാൽ ഇങ്ങനെ ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ട രേഖകളിൽ കൂടുതലും ഇന്ത്യയ്ക്കു പുറത്തുനിന്ന് എത്തിയവയാണ്. അതായത്, ഇന്നു പൊതുജനത്തിനു ലഭിക്കുന്ന പൊതുസഞ്ചയരേഖകൾ കൂടുതലും വിദേശത്തെ യൂണിവേഴ്സിറ്റികളിലെയും സ്വകാര്യ അന്താരാഷ്ട്ര കമ്പനികളുടെയും പ്രയത്നങ്ങളുടെ ഭാഗമായുണ്ടായ ശേഖരങ്ങളിൽനിന്ന് ഉള്ളതാണ്. ഇതിൽ ഏറ്റവും മുന്നിൽ നിൽക്കുന്ന രണ്ടു സ്വകാര്യസംരംഭങ്ങൾ താഴെ പറയുന്നവയാണ്.

ഈ രണ്ടു സംരംഭങ്ങളിലും മലയാളവും കേരളവും ആയി ബന്ധപ്പെട്ട പൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൽ സ്കാനുകൾ  കുറച്ചൊക്കെ കാണാം. യൂറോപ്പിലെയും അമേരിക്കയിലേയും യൂണിവേഴ്സിറ്റി ലൈബ്രറികളിലെ പുസ്തകങ്ങൾ മൊത്തത്തിൽ സ്കാൻ ചെയ്യുമ്പോൾ സന്ദർഭവശാൽ ഇടയിൽപ്പെട്ടുപോകുന്ന മലയാള പൊതുസഞ്ചയരേഖകളാണ് ഇവയെല്ലാം.

ഇനി കേരളത്തിലേക്കു വന്നാൽ പൊതുസഞ്ചയരേഖകൾ ഡിജിറ്റൈസ് ചെയ്യുന്ന ധാരാളം പദ്ധതികൾ വിവിധ സർക്കാർസ്ഥാപനങ്ങളിൽ നടക്കുന്നുണ്ട്. ഉദാഹരണമായി State Central Library Kerala യുടെ RareBooks Online ശേഖരം കേരള സാഹിത്യ അക്കാദമിയുടെ ഓൺലൈൻ ശേഖരം, കേരള സർവകലാശാല, കാലടി ശ്രീശങ്കര സംസ്കൃത സർവകലാശാല, കോഴിക്കോട് സർവകലാശാല എന്നിവിടങ്ങളിലെ ലൈബ്രറികളിലെ ഡിജിറ്റൈസേഷൻ ഇതിൽ കേരള സാഹിത്യ അക്കാദമിയുടെ ശേഖരം മാത്രം ആർക്കൈവ്.ഓർഗിലൂടെ പൊതുജനങ്ങൾക്ക് ഉപകാരപ്പെടുന്ന രീതിയിൽ പങ്കുവയ്ക്കാൻ ശ്രമിച്ചു കൊണ്ടിരിക്കുന്നു. ഇത് ശ്ലാഘനീയമായമാണ്.

എന്നാൽ State Central Library Kerala യുടെ RareBooks Onlinലെ പുസ്തകങ്ങൾ  ഡൗൺലൊഡ് ചെയ്യാനോ ലിങ്കുകൾ പങ്കുവയ്ക്കാനോ ഒന്നും സാധിക്കാത്ത വിധത്തിൽ ഉപയോഗശൂന്യമാണ്.

പൊതുസഞ്ചയ രേഖകൾ ആണെങ്കിലും മറ്റു സ്ഥാപനങ്ങൾ (കേരള സർവകലാശാല, കാലടി ശ്രീശങ്കര സംസ്കൃത സർവകലാശാല, കോഴിക്കോട് സർവകലാശാല) ഒന്നുംതന്നെ ഡിജിറ്റൈസ് ചെയ്ത രേഖകൾ പൊതുജനങ്ങൾക്കു ലഭ്യമാക്കിയിട്ടില്ല. ഉദാഹരണത്തിന്, കേരള സർവകലാശാലയുടെ ഡിജിറ്റൈസേഷൻ പദ്ധതിപ്രകാരം 26,000-ത്തോളം കൈയെഴുത്തുപ്രതികൾ (താളിയോലകളാണെന്നു കരുതുന്നു) ഡിജിറ്റൈസ് ചെയ്തിട്ടുണ്ട്. അതുപോലെ ശ്രീശങ്കര സർവകലാശാലയും ഏറെ താളിയോലകൾ ഡിജിറ്റൈസ് ചെയ്തിട്ടുണ്ട്. ഇത് ഓൺലൈനിൽ ലഭ്യമാക്കാൻ കാര്യമായ ചെലവൊന്നുമില്ലെങ്കിലും ഇതൊന്നും പൊതുജനത്തിന് ഇപ്പോഴും ലഭ്യമല്ല. ചുരുക്കത്തിൽ സർക്കാർസ്ഥാപനങ്ങൾ വഴി ഡിജിറ്റൈസേഷൻ നടന്നതു മിക്കവാറും ഒന്നുംതന്നെ ഗവേഷകകർക്കും, വിക്കിഗ്രന്ഥശാലയും സായാഹ്നയും പോലെ മലയാള പൊതുസഞ്ചയരേഖകളുമായി ബന്ധപ്പെട്ടു പ്രവർത്തിക്കുന്നവർക്കും  മറ്റും  ഉപയോഗത്തിനു ലഭ്യമല്ല. പൊതുപ്പണം ഉപയോഗിച്ചാണ് ഈ പൊതുസഞ്ചയ രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ടത് എന്ന യാഥാർത്ഥ്യം കൂടി കണക്കിലെടുക്കുമ്പോൾ  ഇതു ഖേദകരമാണ്.

നിലവിലെ പ്രശ്നങ്ങളും പരിഹാരങ്ങളും

പഴയതു നശിപ്പിച്ചുകളയുന്ന പാരമ്പര്യം

പഴയ രേഖകളിലെ ഉള്ളടക്കവും ആ രേഖയുമായി ബന്ധപ്പെട്ട മെറ്റാഡാറ്റയും സംരക്ഷിക്കപ്പെടേണ്ട ഒന്നാണെന്നുള്ള ബോദ്ധ്യം നമ്മുടെ സമൂഹത്തിന് ഇനിയും വന്നിട്ടില്ല. പുരാതനരേഖകൾ സൂക്ഷിച്ചുവയ്ക്കാത്ത നമ്മുടെ പാരമ്പര്യം ഇത്തരം രേഖകൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിൽ വലിയ തടസ്സമാണ്. പഴയതായാൽ കത്തിച്ചുകളയാനുള്ളതോ കുഴിച്ചിടാനുള്ളതോ ആണെന്ന സംസ്കാരം മൂലം വളരെയധികം രേഖകൾ നശിച്ചുപോയി. മറ്റൊരു പ്രശ്നം ഈ രേഖകൾ കൈവശമുള്ളവരിൽ ബഹുഭൂരിപക്ഷത്തിനും അത് ഡിജിറ്റൈസ് ചെയ്യാനായി പങ്കിടാൻ മടിയാണ്. പങ്കിടാനുള്ള താൽപര്യമില്ലായ്മ, നഷ്ടപ്പെടുമോ അല്ലെങ്കിൽ കേടുവരുത്തുമോ എന്നുള്ള ഭയം, സ്വന്തം കൈയ്യിലുള്ളത് വേരൊരാൾക്കു പങ്കിട്ടാൽ അതിന്റെ പേരിലുള്ള പെരുമ നഷ്ടമാകും എന്ന ചിന്ത ഇതൊക്കെയായിരിക്കാം പൊതുസഞ്ചയരേഖകൾ രഹസ്യമായി സൂക്ഷിക്കുന്നതിന്റെ കാരണങ്ങൾ. കാലപ്പഴക്കംകൊണ്ടു നശിച്ചുപോകുന്നതിനു പുറമേ, ഈ വിധത്തിൽ പൊതുസഞ്ചയരേഖകൾ രഹസ്യമായി സൂക്ഷിക്കുന്ന ആളുകളുടെ അടുത്ത തലമുറ ഈ വിഷയങ്ങളിൽ താല്പര്യമില്ലാത്തവർ ആണെങ്കിൽ ഇത്തരം രേഖകൾ ഒക്കെ കാലക്രമേണ അവർ നശിപ്പിക്കാനാണ് സാദ്ധ്യത. ഇങ്ങനെയും ഏറെ രേഖകൾ നശിച്ചുപോയിരിക്കാം.

ഈ സ്ഥിതി മാറി, പഴയ രേഖകൾ നശിപ്പിക്കുന്നതിനുപകരം ലൈബ്രറികളിലേക്കോ മറ്റോ കൈമാറാൻ ഉള്ള അവബോധം നമുക്കിടയിൽ വളർത്തണം. ചുരുങ്ങിയ പക്ഷം, നശിപ്പിച്ചുകളയുന്നതിനു മുൻപ് അതു ഡിജിറ്റൈസ് ചെയ്യാനുള്ള ശ്രമമെങ്കിലും ഉണ്ടാവണം.

മാസ്റ്റർ ഇൻഡെക്സിന്റെ പ്രാധാന്യം

ഒരു ഓൺലൈൻ മാസ്റ്റർ ഇൻഡെക്സ് ഇല്ലാത്തത് വലിയൊരു പ്രശ്നമാണ്. പഴയ രേഖകൾക്കായി തെരയുമ്പോൾ, നമ്മൾ എന്തൊക്കെ തേടണം എന്ന കാര്യത്തിൽ വ്യക്തതയുണ്ടാവാൻ ഇത് അത്യാവശ്യമാണ്. നിലവിൽ മലയാളപുസ്തകങ്ങളുടെ വിവരത്തിന് ആശ്രയിക്കാവുന്നത് കെ.എം. ഗോവിയുടെ ഇൻഡെക്സ് മാത്രമാണ്. അദ്ദേഹം വളരെ ശ്രമപ്പെട്ടു തയാറാക്കിയിട്ടുള്ള ഈ ഇൻഡെക്സ് ഈ മേഖലയിൽ പ്രവർത്തിക്കുന്നവർക്ക് എത്രമാത്രം സഹായകരമാണെന്ന കാര്യം വാക്കുകളിലൊതുക്കാവുന്നതല്ല. കെ.എം. ഗോവിയുടെ ഇൻഡെക്സിൽ ഉൾപ്പെടാത്ത പുസ്തകങ്ങളും ഈ ലേഖകർക്കു കണ്ടെത്താനായിട്ടുണ്ട് (ഉദാഹരണം: പൗളിനൊസ് പാതിരിയുടെ  ആൽഫബെറ്റ ഇൻഡിക്ക, സിസ്റ്റമ ബ്രഹ്മാണിക്കം, 1852ൽ ഇറങ്ങിയ ഹെർമ്മൻ ഗുണ്ടർട്ടിന്റെ  പുതിയ നിയമത്തിലെ ലേഖനങ്ങൾ, തുടങ്ങിയ പുസ്തകങ്ങൾ).

ഇത്തരത്തിൽ കണ്ടെത്തുന്ന പുസ്തകങ്ങളെക്കൂടി ഉൾപ്പെടുത്തി ഈ മാസ്റ്റർ ഇൻഡെക്സ് തുടർച്ചയായി നവീകരിക്കേണ്ടത് അത്യാവശ്യമാണ്. ഇത് ഒരു ഓൺലൈൻ പരിപാടി ആയിരിക്കുകയും വേണം.

ഒരേപുസ്തകം ഒന്നിലേറെ തവണ ഡിജിറ്റൈസ് ചെയ്യുന്നതിലെ പ്രശ്നം

ഇനി ഡിജിറ്റൈസ് ചെയ്യുന്ന രേഖകളുടെ കാര്യത്തിലേക്കു വരാം. പഴയ രേഖകളുടെ ഒരു മാസ്റ്റർ ഡിജിറ്റൽ ശേഖരമോ ഇത്തരം പദ്ധതികളെ എല്ലാംകൂടി ക്രോഡീകരിക്കുന്ന ഒരു വ്യക്തിയോ ഇല്ലാത്തതുമൂലം, പല പഴയ രേഖകളും ഒന്നിലേറെ തവണ ഡിജിറ്റൈസ് ചെയ്യപ്പെടുന്നു. ഒരേ പുസ്തകം (അതും ഒരേ പതിപ്പ്) ഇങ്ങനെ വിവിധ സ്ഥാപനങ്ങളിൽ ഡിജിറ്റൈസ് ചെയ്യുന്നതുമൂലം ഉണ്ടാകുന്ന വിഭവനഷ്ടം എത്രയാണെന്നു പറയേണ്ടതില്ലല്ലോ.

വിവിധ സ്ഥാപനങ്ങളിൽ നടക്കുന്ന ഡിജിറ്റൈസേഷൻ പരിപാടികൾ ഒരാൾ ക്രോഡീകരിച്ച് മാസ്റ്റർ ഇൻഡെക്സ് ലിസ്റ്റിൽ ഡിജിറ്റൈസേഷൻ കഴിഞ്ഞ പുസ്തകങ്ങൾ അടയാളപ്പെടുത്തുക എന്നതാണ് ഇതിനുള്ള പരിഹാരം. ഇതിനു പക്ഷെ സർക്കാർതലത്തിൽത്തന്നെ ഇടപെടൽ ആവശ്യമാണ്.

ഡിജിറ്റൈസ് ചെയ്ത പൊതുരേഖകൾ പങ്കുവയ്ക്കാത്തതിലെ പ്രശ്നം

നമ്മുടെ സ്ഥാപനങ്ങൾ ഡിജിറ്റൈസ് ചെയ്ത പൊതുരേഖകൾ എല്ലാവർക്കുമായി തുറന്നുകൊടുക്കുന്നില്ല. ഇതുമൂലം ഈ മേഖലയിൽ പ്രവർത്തിക്കുന്ന സന്നദ്ധപ്രവർത്തകർക്ക് ഈ പുസ്തകങ്ങൾ തപ്പിപിടിച്ചു പിന്നെയും സ്കാൻ ചെയ്ത് ഡിജിറ്റൈസ് ചെയ്യേണ്ടിവരുന്നു. ഉദാഹരണമായി, ഈ ലേഖകരുടെ പ്രയത്നത്തിൽ ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ട സംക്ഷേപ വേദാർത്ഥം, റമ്പാൻ ബൈബിൾ, ഘാതകവധം, ശബ്ദതാരാവലി തുടങ്ങിയ കൃതികൾ. ഈ കൃതികളൊക്കെ കേരളത്തിലെ വിവിധയിടങ്ങളിൽ നടക്കുന്ന ഡിജിറ്റൈസെഷന്റെ ഭാഗമായി ഡിജിറ്റൈസ് ചെയ്യപ്പെട്ടതാണെങ്കിലും അതു വിക്കിഗ്രന്ഥാശാല, സായാഹ്ന തുടങ്ങിയ സന്നദ്ധപ്രവർത്തകരുടെ ഉപയോഗത്തിനു തുറന്നുകൊടുക്കാത്തതുമൂലം ഈ സന്നദ്ധപ്രവർത്തകർക്ക് ഈ പുസ്തകങ്ങൾ പിന്നെയും കണ്ടെത്തി ഡിജിറ്റൈസ് ചെയ്യേണ്ടിവരുന്നു. ഇത് സന്നദ്ധപ്രവർത്തകരുടെ വിലയേറിയ സമയം നഷ്ടപ്പെടുത്തുന്നു. ഈ സ്ഥിതി മാറണം.

ഡിജിറ്റൈസ് ചെയ്ത പൊതുസഞ്ചയത്തിലുള്ള രേഖകൾ നിർബന്ധമായും പൊതുജനങ്ങൾക്കു ലഭ്യമാക്കിയിരിക്കണം എന്ന നയം നിയമം മൂലമോ മറ്റോ നടപ്പാക്കുക മാത്രമാണ് ഇതിനുള്ള പരിഹാരം. പകർപ്പവകാശകാലാവധി കഴിഞ്ഞിട്ടില്ലാത്ത രേഖകൾ മാത്രമേ ജനങ്ങൾക്കു പങ്കിടാതെ സൂക്ഷിക്കേണ്ടതുള്ളൂ. ബാക്കി എല്ലാ പൊതുസഞ്ചയരേഖകളും പൊതുവുപയോഗത്തിനായി നൽകണം. ഇതിന് യൂറോപ്യൻ യൂണിയന്റെ ഡിജിറ്റൽ ലൈബ്രറി നമുക്കു മാതൃകയായെടുക്കാം.

ഡിജിറ്റൈസ് ചെയ്യാനുള്ള സൗകര്യങ്ങളുടെ അപര്യാപ്തി

പഴയ രേഖകളുടെ സ്കാനിങ് അതീവശ്രദ്ധയോടെ ചെയ്യേണ്ട കാര്യമാണ്. ഫ്ലാറ്റ്ബെഡ് സ്കാനറുകളിലോ ഓട്ടോമാറ്റിക് ബുക്ക് സ്കാനറുകളിലോ സ്കാൻ ചെയ്താൽ പഴയപുസ്തകങ്ങൾ കേടുവരാനുള്ള സാദ്ധ്യതയുണ്ട്.
പുസ്തകം സ്കാൻ ചെയ്യാനായി ലക്ഷക്കണക്കിനു രൂപ വിലയുള്ള ബുക്ക് സ്കാനറുകൾ ഉണ്ടെങ്കിലും അതു മിക്കവർക്കും അപ്രാപ്യമാണ്. അതിനാൽ ഡിജിറ്റൽ ക്യാമറ  ഉപയോഗിച്ചു ഫോട്ടോ എടുത്താണ് മിക്ക ഡിജിറ്റൈസേഷൻ പദ്ധതികളും മുന്നേറുന്നത്. നിശ്ചിത ഉയരത്തിൽ ക്യാമറ ഉറപ്പിച്ച് ഏറെ ശ്രമകരമായി ഓരോ പേജും പ്രത്യേകം ഫോട്ടോ എടുത്താണ് ഇതു ചെയ്യുന്നത്.

ഏകദേശം ഇതേ വിധത്തിൽ ഡിജിറ്റൽ ക്യാമറകൾ ഉപയോഗിച്ചാണ് മിക്ക സ്ഥലത്തും പുസ്തകം ഡിജിറ്റൈസ് ചെയ്യുന്നത്. ക്യാമറയിലെടുക്കുന്ന പടങ്ങളുടെ ചെരിവും മറ്റു പ്രശ്നങ്ങളും പോസ്റ്റ് പ്രോസസിങ്ങിൽ വളരെ പ്രതിബന്ധങ്ങൾ സൃഷ്ടിക്കും. അതിനാൽ ഈ ഘട്ടം അതീവ ശ്രദ്ധയോടെ ചെയ്യേണ്ട ഒന്നാണ്.
സർക്കാർ/സംഘടനകളുടെ കൈയ്യിലുള്ള സ്കാനിങ്, പോസ്റ്റ് പ്രോസസിങ് സൗകര്യം ജനങ്ങൾക്ക് ഉപയോഗിക്കാൻ കഴിയണം. പുസ്തകങ്ങളുടെ ഫോട്ടോ എടുത്തുകിട്ടിയാൽത്തന്നെ സന്നദ്ധപ്രവർത്തകരുടെ ജോലി വളരെ എളുപ്പമാകും.

ഓ.സി.ആർ.

ഒരു പൊതുരേഖ സ്കാൻ ചെയ്തു കിട്ടിയാൽ അടുത്ത പ്രധാന ജോലി പുസ്തകത്തിലെ ഉള്ളടക്കം ടെക്സ്റ്റ് രൂപത്തിലേക്കു മാറ്റുകയാണ്. ഇത് ഉള്ളടക്കം തെരഞ്ഞുകണ്ടുപിടിക്കൽ എളുപ്പമാക്കുന്നു. ഇതിലൂടെ ഉള്ളടക്കത്തിന്റെ ലഭ്യത (accessibility) പതിന്മടങ്ങു വർദ്ധിക്കും. നല്ലൊരു ഓ.സി.ആർ. എഞ്ചിൻ ഉണ്ടെങ്കിൽ ടെക്സ്റ്റ് കൺവേർഷൻ വളരെ എളുപ്പത്തിൽ ചെയ്യാം. നിർഭാഗ്യവശാൽ മലയാളത്തിനു നല്ലൊരു ഓ.സി.ആർ. പ്രോഗ്രാമിന്റെ അഭാവമുണ്ട്. ഈ മേഖലയാണ് സാങ്കേതികവിദ്യാരംഗത്തു പ്രവർത്തിക്കുന്നവർ ഏറ്റവും ശ്രദ്ധനൽകേണ്ടതെന്നു വിചാരിക്കുന്നു.

ടെസ്സറാക്റ്റ് അടിസ്ഥാനമാക്കി ഓ.സി.ആർ. പലരും പരീക്ഷണാടിസ്ഥാനത്തിൽ ഉപയോഗിക്കുന്നുണ്ടെങ്കിലും അത് ഏവർക്കും ഉപയോഗയോഗ്യമായ നിലയിലേക്കു വന്നിട്ടില്ല. പിന്നെയൊന്ന് ഗൂഗിൾ ഈയിടെ ഗൂഗിൾ ഡോക്സിനോടൊപ്പം ഇന്റഗ്രേറ്റ് ചെയ്തിട്ടുള്ള ഓ.സി.ആർ. എഞ്ചിനാണ്. ഇത് പുതിയ ഫോണ്ടുകളിലുള്ള സ്കാൻ വളരെ നന്നായി പ്രോസസ് ചെയ്ത് ടെക്സ്റ്റ് ഔട്ട്പുട്ട് തരുമെങ്കിലും പഴയ പുസ്തകങ്ങളുടെ കാര്യത്തിൽ അതു തരുന്ന ഫലം അത്ര പോര. എന്നിരുന്നാലും ഇന്ന് ആശ്രയിക്കാവുന്നതിൽവച്ച് നല്ലൊരു ഓ.സി.ആർ. എഞ്ചിൻ ഗൂഗിൾ ഡോക്സ് വഴിയുള്ളതാണ്.

സ്കാൻ നോക്കി/അല്ലെങ്കിൽ പുസ്തകം നോക്കി ടൈപ്പ് ചെയ്ത് അതിലെ ഉള്ളടക്കം ടെക്സ്റ്റ് ആക്കി മാറ്റുക എന്നതാണ് ടെക്സ്റ്റ് കൺവേർഷനുള്ള ഏറ്റവും പ്രാകൃതമായ വഴി. ഇന്നു വിക്കിഗ്രന്ഥശാലയിലെയും സായാഹ്നഫൗണ്ടേഷനിലെയും മറ്റും സന്നദ്ധപ്രവർത്തകർ കൂടുതലും ഈ രീതിയിലാണ് മലയാളപൊതുസഞ്ചയ രേഖകളുടെ ടെക്സ്റ്റ് കൺവേർഷൻ നടത്തുന്നത്. അത്യാവശ്യം കൃത്യതയോടെ ഓ.സി.ആർ. ആക്കി മാറ്റുന്ന ഒരു ടൂൾ, ഈ സന്നദ്ധപ്രവർത്തകരുടെ അദ്ധ്വാനം ലഘൂകരിക്കുകയും അങ്ങനെ കൂടുതൽ പുസ്തകങ്ങൾ ടെക്സ്റ്റ് രൂപത്തിൽ ലഭ്യമാകുകയും ചെയ്യും.

ഉള്ളടക്കപ്പഴമ പ്രതിനിധാനം ചെയ്യാനുതകുന്ന ഫോണ്ടുകളുടെ നിർമ്മിതി

ടെക്സ്റ്റ് ആക്കി മാറ്റിയതിനുശേഷവും പഴയകാലമലയാളത്തെ അതേപോലെ പ്രതിനിധീകരിക്കാൻ  അക്കാലത്തേതുപോലെയുള്ള ഫോണ്ടുകളുണ്ടാവേണ്ടത്, അത്തരം പുസ്തകങ്ങളുടെ തനിമ നിലനിർത്തുന്നതിനു സുപ്രധാനമാണ്. ഉദാഹരണമായി, ഇന്നുപയോഗിക്കുന്ന പല അക്ഷരങ്ങളും (പ്രത്യേകിച്ച് കൂട്ടക്ഷരങ്ങൾ) പണ്ട് വ്യത്യസ്തമായായിരുന്നു എഴുതിയിരുന്നത്. ഇതു കാണിക്കാൻ പഴയകാലരീതിയിലുള്ള ഫോണ്ടുകളിലൂടെ സാധിക്കും.

പഴയകാലത്തെ രീതിയിലുള്ള ഫോണ്ടുകൾ നിർമ്മിക്കുന്നതുകൊണ്ട് മറ്റൊരു ഗുണം കൂടിയുണ്ട്. ഇത്തരം ഫോണ്ടുകൾ ഓ.സി.ആർ. എഞ്ചിനുകളിൽ ഉപയോഗപ്പെടുത്തി, പഴയകാല പ്രിന്റുകളുടെ മെച്ചപ്പെട്ട ഓ.സി.ആർ. റിസൾട്ട് നേടാനാകും എന്നതാണത്.

പൊതുസഞ്ചയരേഖകളുടെ ശേഖരണവും പങ്കിടലും

നല്ല നിലവാരത്തിൽ സ്കാൻ ചെയ്ത പുസ്തകങ്ങൾ ഡിജിറ്റൽ ഫോർമാറ്റിൽ ശേഖരിച്ചുവയ്ക്കുന്നതിന് ഏറെ സ്റ്റോറേജ് സ്പേസ് ആവശ്യമാണ്. അതുപോലെ, ഈ വിവരങ്ങൾ സദാസമയവും ആളുകൾക്ക് ഓൺലൈനിൽ ലഭ്യമായിരിക്കുകയും വേണം. നിലവിൽ പുരാതനരേഖകൾ ശേഖരിക്കുന്നതിനും പങ്കിടുന്നതിനുമായി വിവിധ വെബ്സൈറ്റുകൾ നിലവിലുണ്ട്. ഗൂഗിൾ ബുക്സ് അവർ ഡിജിറ്റൈസ് ചെയ്യുന്ന രേഖകൾ https://books.google.com/ എന്ന സൈറ്റിൽ നൽകുന്നുണ്ട്. അതേ സമയം ഏതൊരാൾക്കും രേഖകൾ അപ്‌ലോഡ് ചെയ്യാനും ആവശ്യംപോലെ തിരിച്ചെടുക്കാനും ആവശ്യമായ പേജുകളിലേക്കു റെഫർ ചെയ്യാനും സാദ്ധ്യമായ വെബ്സൈറ്റുകളും നിലവിലുണ്ട്.

ഇതിലൊന്ന് വിക്കിമീഡിയ കോമൺസാണ്. പൊതുവേ പറഞ്ഞാൽ1923-ന് മുമ്പ് പുറത്തിറങ്ങിയ രേഖകൾ pdf ഫോർമാറ്റിൽ നമുക്ക് ഇതിൽ അപ്‌ലോഡ് ചെയ്യാനാകും. മലയാളത്തിലെ വിക്കിഗ്രന്ഥശാല പോലുള്ള സംരംഭങ്ങളിലൂടെ ഈ രേഖകൾ പൊതുജനപങ്കാളിത്തത്തോടെ ടെക്സ്റ്റ് രൂപത്തിലേക്കു കൺവേർട്ട് ചെയ്യാനും സാധിക്കും. അമേരിക്കൻ നിയമങ്ങൾക്കനുസരിച്ചും പകർപ്പവകാശകാലാവധി തീർന്നെങ്കിൽ മാത്രമേ വിക്കിമീഡിയയിൽ അപ്‌ലോഡ് ചെയ്യാനാകൂ.

ആർക്കൈവ്.ഓർഗ് ആണ് മറ്റൊന്ന്. സ്കാൻ ചെയ്തു പ്രോസസ് ചെയ്ത ചിത്രങ്ങളിൽ നിന്ന് pdf, epub, kindle ഫോർമാറ്റുകളിലുള്ള ഫയലുകൾ സ്വയം നിർമ്മിക്കുന്ന ഈ സൈറ്റ്, പോസ്റ്റ് പ്രോസസിങ് ജോലികൾ ഏറെ ലഘൂകരിക്കുന്നു.

നിലവിൽ ഈ രണ്ടു സൈറ്റുകൾ വിവരശേഖരണകാര്യത്തിൽ നമ്മുടെ ആവശ്യങ്ങൾക്ക് ഒരു പരിധിവരെ പര്യാപ്തമാണ്.എന്നാൽ ഇന്ത്യൻ നിയമം അനുസരിച്ച് രചയിതാവു മരിച്ച് 60 വർഷം കഴിഞ്ഞാലാണ് അവർ പ്രസിദ്ധീകരിച്ച രചനകൾ പൊതുസഞ്ചയത്തിൽ വരിക. അതിനാൽ ഇന്ത്യൻ നിയമം അനുസരിച്ച്, നിലവിൽ 1955നു മുൻപു മരിച്ചവരുടെ 1955നു മുൻപു പ്രസിദ്ധീകരിച്ച രചനകളൊക്കെ പൊതുസഞ്ചയത്തിൽ ആണ്. എന്നാൽ വിക്കിമീഡിയ, ആർക്കൈവ്.ഓർഗ് സെർവറുകൾ അമേരിക്കയിൽ ആയതിനാൽ നിയമം അനുസരിച്ച് 1922നു ശേഷമുള്ള രേഖകൾ അപ്‌ലോഡ് ചെയ്യുന്നതു നിയമവിരുദ്ധമാണ്. അതിനാൽ 1923മുതൽ 1954 വരെയുള്ള രേഖകൾ ശേഖരിക്കാൻ ഇന്ത്യൻ നിയമം അനുസരിക്കുന്ന ഒരു ഇന്ത്യൻ സർവ്വർ കൂടി ഉള്ളതു നല്ലതാണ്. മലയാള പുസ്തകങ്ങളെ സംബന്ധിച്ചിടത്തോളം ഈ പ്രശ്നം പരിഹരിക്കാൻ  ഇപ്പോൾ സായാഹ്ന മുൻപോട്ട് വന്നിട്ടൂണ്ട്. തിരുവനന്തപുരത്തെ സർവ്വർ ആണ് ഇക്കാര്യങ്ങൾക്ക് ഉപയോഗിക്കുന്നത്.

ഉപസംഹാരം

പൊതുസഞ്ചയ രേഖകൾ എളുപ്പത്തിൽ ലഭ്യമായാൽ അതുമായി ബന്ധപ്പെട്ട ഗവേഷണപദ്ധതികൾക്കു വളരെ ഉപകാരപ്പെടും. ഇത് മലയാളഭാഷാപഠനം, കേരളവുമായി ബന്ധപ്പെട്ട ഗവേഷണങ്ങൾ എന്നിവയ്ക്കൊക്കെ വളരെ  പ്രയോജനപ്രദമാവും. മുകളിൽ ചർച്ച ചെയ്ത കാര്യങ്ങൾ ക്രോഡീകരിച്ചാൽ നിലവിൽ പഴയ മലയാളരേഖകളുടെ ഡിജിറ്റൈസേഷൻ രംഗത്ത് ശ്രദ്ധയുന്നേണ്ട മേഖലകൾ താഴെപ്പറയുന്നവയാണ്.

  • പുരാതനരേഖകൾ സംരക്ഷിക്കാനും രേഖകൾ ഡിജിറ്റൈസേഷനായി പങ്കിടാനും പ്രോൽസാഹിപ്പിക്കാനായി സമൂഹത്തിൽ അവബോധം സൃഷ്ടിക്കൽ (പരസ്യങ്ങൾ ഉപയോഗപ്പെടുത്തണം)
  • പുരാതനരേഖകളുടെ മാസ്റ്റർ ഇൻഡെക്സ് തയാറാക്കണം. അത് തുടർച്ചയായി നവീകരിക്കണം.
  • മാസ്റ്റർ ഇൻഡെക്സ് പരിശോധിക്കാനായി ഓൺലൈനിൽ എപ്പോഴും ലഭ്യമാകണം.
  • ഡിജിറ്റൈസേഷൻ പദ്ധതികൾ ക്രോഡീകരിക്കാനായും ഒരേ പുസ്തകം ഒന്നിലേറെ തവണ ഡിജിറ്റൈസ് ചെയ്യുന്നതും മറ്റും ഒഴിവാക്കാനും മാസ്റ്റർ ഇൻഡക്സ് തുടർച്ചയായി നവീകരിക്കാനും ഒക്കെയായി സംവിധാനം വേണം; ഈ വിഷയത്തിൽ അവബോധം ഉള്ളവരെ ഇതിനു നിയമിക്കണം.
  • സർക്കാർതലത്തിലും അല്ലാതെയും ഡിജിറ്റൈസ് ചെയ്യുന്ന പൊതുസഞ്ചയരേഖകൾ അപ്പപ്പോൾ പൊതുജനങ്ങൾക്കു ലഭ്യമാക്കണം.
  • വിക്കിഗ്രന്ഥശാല, സായാഹ്ന തുടങ്ങിയവയിൽ പ്രവർത്തിക്കുന്ന സന്നദ്ധപ്രവർത്തകർ വിവിധ ഇടങ്ങളിൽനിന്നു തപ്പിപ്പിടിച്ചു കൊണ്ടുവരുന്ന പൊതുസഞ്ചയരേഖകളുടെ സ്കാനിങ്ങും – പോസ്റ്റ് പ്രോസസിങും മറ്റും ചെയ്യാനാനുള്ള സൗകര്യങ്ങൾ ഒരുക്കിക്കൊടുക്കണം.
  • മലയാളത്തിനായി നല്ല ഓ.സി.ആറിന്റെ നിർമ്മാണത്തിനായുള്ള സഹായം. ഈ മേഖലയിൽ പ്രവർത്തിക്കുന്ന SMC പോലുള്ള സംഘടനകളെ സഹായിച്ചാൽ മതിയാകും.
  • പഴയ രേഖകളിലുള്ള ഫോണ്ടുകൾ പുനഃസൃഷ്ടിക്കൽ. ഇതിനും ഈ മേഖലയിൽ പ്രവർത്തിക്കുന്ന സംഘടനകളെ സഹായിച്ചാൽ മതിയാകും.

ഈ മേഖലകളിൽ ഊന്നിയുള്ള സർക്കാരിന്റെയും സന്നദ്ധസംഘടനകളുടെയും പ്രവർത്തനങ്ങളും സഹായങ്ങളും പുരാതനമലയാളരേഖകളുടെ ഡിജിറ്റൈസേഷനും പങ്കിടലിനും പ്രോൽസാഹനം നൽകുകയും കൂടുതൽ കൂടുതൽ രേഖകൾ ഏവരുടെയും ഉപയോഗത്തിനായി ലഭ്യമാക്കുകയും ചെയ്യും. അങ്ങനെ നമ്മുടെ അമൂല്യമായ പൊതുസഞ്ചയ രേഖകളെ അനശ്വരമാക്കുകയും ചെയ്യാം.

 

Comments

comments

Google+ Comments

This entry was posted in പൊതുസഞ്ചയ പുസ്തകങ്ങൾ. Bookmark the permalink.

One Response to മലയാളപൊതുസഞ്ചയരേഖകളുടെ ഡിജിറ്റൈസേഷൻ – നിലവിലെ സ്ഥിതിയും സാദ്ധ്യതകളും

  1. Pingback: മലയാള പൊതുസഞ്ചയ കൃതികളുടെ ഡിജിറ്റൽ പതിപ്പ് – കേരളത്തിലെ സ്ഥിതി | abundance of the heart

Leave a Reply