ஒரு அறிவியல் திசையாக கணக்கீட்டு மொழியியலின் வரலாறு, வளர்ச்சி மற்றும் உருவாக்கம். கணக்கீட்டு மொழியியல் என்றால் என்ன

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

வாழ்க்கையில் நவீன சமுதாயம்தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் வளர்ச்சி தகவல் தொழில்நுட்பங்கள்மிகவும் சமமாக நிகழ்கிறது: தற்போதைய நிலை என்றால் கணினி தொழில்நுட்பம்தகவல்தொடர்பு வழிமுறைகள் ஆச்சரியமானவை, ஆனால் தகவல்களின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் எளிமையானவை. இந்த வெற்றிகள் முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை உருவகப்படுத்தும் திறன் ஆகியவற்றின் ஆய்வில் சாதனைகள் சார்ந்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரைத் தகவல்களை தானாக செயலாக்குவதில் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்திக்கும் கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - தகவல்களின் கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். கணினி மொழியியல் அறிவியல் தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களைக் கையாள்கிறது. இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் உள்ள தகவல்களை தானியங்கு முறையில் மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் தொகுப்புக்கான அமைப்புகள் உருவாக்கப்பட்டது வாய்வழி பேச்சுமற்றும் பலர். மொழியியல் ஆராய்ச்சியின் போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு இந்த வேலை அர்ப்பணிக்கப்பட்டுள்ளது.


1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

IN நவீன உலகம்பல்வேறு மொழியியல் ஆய்வுகளில் கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களை இயந்திர மொழிபெயர்ப்பிற்கான சோதனை மற்றும் தொழில்துறை அமைப்புகள் உருவாக்கப்பட்டுள்ளன, இயற்கை மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டமைக்கப்பட்டுள்ளன. , டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ், முதலியன) உருவாக்கும் பணி நடந்து வருகிறது, தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்புக்கான அமைப்புகள் கட்டமைக்கப்படுகின்றன (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை. .), இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடத்தப்படுகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடு ஆகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சிக்கான அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

IN நடைமுறை நடவடிக்கைகள்தகவல் மையங்கள் கணினியில் உள்ளிடும்போது உரைகளில் உள்ள பிழைகளை தானியங்கு கண்டறிதல் மற்றும் திருத்தம் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - உரைகளின் எழுத்து, தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாடு. அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்காக வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துப்பிழைக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது அபிவிருத்தி சிக்கலான அமைப்புஉரை உறுப்புகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்கும் விதிகள். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.

ஆவணங்கள் மற்றும் வினவல்களின் அட்டவணைப்படுத்தலை தானியங்குபடுத்துவதில் உள்ள சிக்கல் தானியங்கு உரை தகவல் மீட்டெடுப்பு அமைப்புகளுக்கு பாரம்பரியமானது. முதலில், அட்டவணைப்படுத்தல் என்பது அவற்றின் கருப்பொருள் உள்ளடக்கத்தை பிரதிபலிக்கும் ஆவணங்கள் மற்றும் வினவல்களுக்கு வகைப்படுத்தல் குறியீடுகளை ஒதுக்கும் செயல்முறையாக புரிந்து கொள்ளப்பட்டது. பின்னர், இந்த கருத்து மாற்றப்பட்டது மற்றும் "அட்டவணை" என்ற சொல் ஆவணங்கள் மற்றும் வினவல்களின் விளக்கங்களை இயற்கை மொழியிலிருந்து முறைப்படுத்தப்பட்ட மொழியில், குறிப்பாக, "தேடல் படங்கள்" மொழியில் மொழிபெயர்க்கும் செயல்முறையைக் குறிக்கத் தொடங்கியது. ஆவணங்களின் தேடல் படங்கள், ஒரு விதியாக, அவற்றின் கருப்பொருள் உள்ளடக்கத்தைப் பிரதிபலிக்கும் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களின் பட்டியல்களின் வடிவத்தில் வரையப்படத் தொடங்கின, மேலும் வினவல்களின் படங்களைத் தேடுங்கள் - முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் ஒன்றோடொன்று இணைக்கப்பட்ட தருக்க கட்டமைப்புகளின் வடிவத்தில். தருக்க மற்றும் தொடரியல் ஆபரேட்டர்கள் மூலம்.

ஆவணங்களை அவற்றின் சுருக்கங்களின் (ஏதேனும் இருந்தால்) அடிப்படையில் தானாக அட்டவணைப்படுத்துவது வசதியானது, ஏனெனில் சுருக்கங்கள் ஆவணங்களின் முக்கிய உள்ளடக்கத்தை செறிவூட்டப்பட்ட வடிவத்தில் பிரதிபலிக்கின்றன. அட்டவணைப்படுத்தல் சொற்களஞ்சியம் கட்டுப்பாட்டுடன் அல்லது இல்லாமல் மேற்கொள்ளப்படலாம். முதல் வழக்கில், ஆவணத்தின் தலைப்பின் உரை மற்றும் அதன் சுருக்கம், குறிப்பு இயந்திர அகராதியின் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் தேடப்பட்டு, அகராதியில் உள்ளவை மட்டுமே AML இல் சேர்க்கப்பட்டுள்ளன. இரண்டாவது வழக்கில், முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் உரையிலிருந்து தனிமைப்படுத்தப்பட்டு POD இல் சேர்க்கப்படும், அவை எந்த குறிப்பு அகராதியிலும் இல்லை. மூன்றாவது விருப்பமும் செயல்படுத்தப்பட்டது, அங்கு, இயந்திர சொற்களஞ்சியத்தின் விதிமுறைகளுடன், AML ஆவணத்தின் தலைப்பு மற்றும் முதல் வாக்கியத்திலிருந்து பிரித்தெடுக்கப்பட்ட சொற்களையும் உள்ளடக்கியது. தலைப்புகள் மற்றும் ஆவணங்களின் சுருக்கங்களைப் பயன்படுத்தி தானாக தொகுக்கப்பட்ட PODகள் கைமுறையாக தொகுக்கப்பட்ட PODகளை விட அதிக தேடல் முழுமையை வழங்குவதாக சோதனைகள் காட்டுகின்றன. கையேடு குறியீட்டு முறையை விட தானியங்கி அட்டவணைப்படுத்தல் அமைப்பு ஆவணங்களின் உள்ளடக்கத்தின் பல்வேறு அம்சங்களை முழுமையாக பிரதிபலிக்கிறது என்பதன் மூலம் இது விளக்கப்படுகிறது.

வினவல்களின் தானியங்கி அட்டவணைப்படுத்தல் ஆவணங்களின் தானியங்கு அட்டவணைப்படுத்தல் போன்ற சிக்கல்களை ஏற்படுத்துகிறது. இங்கே நீங்கள் உரையிலிருந்து முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களைப் பிரித்தெடுக்க வேண்டும் மற்றும் வினவல் உரையில் உள்ள சொற்களை இயல்பாக்க வேண்டும். முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்கள் மற்றும் சூழல் ஆபரேட்டர்களுக்கு இடையே உள்ள தருக்க இணைப்புகளை கைமுறையாக அல்லது தானியங்கு செயல்முறையைப் பயன்படுத்தி உள்ளிடலாம். ஒரு முக்கியமான உறுப்புவினவலின் தானியங்கி அட்டவணைப்படுத்தல் செயல்முறையானது, அதன் முக்கிய வார்த்தைகள் மற்றும் சொற்றொடர்களை அவற்றின் ஒத்த சொற்கள் மற்றும் ஹைப்போனிம்களுடன் சேர்ப்பதாகும் (சில நேரங்களில் ஹைபரோனிம்கள் மற்றும் அசல் வினவல் சொற்களுடன் தொடர்புடைய பிற சொற்களும்). இது ஒரு இயந்திர சொற்களஞ்சியத்தைப் பயன்படுத்தி தானாகவே அல்லது ஊடாடும் வகையில் செய்யப்படலாம்.

தானியங்கி அட்டவணையிடல் பணி தொடர்பாக ஆவணத் தகவலுக்கான தேடலை தானியங்குபடுத்துவதில் உள்ள சிக்கலை நாங்கள் ஏற்கனவே ஓரளவு கருத்தில் கொண்டுள்ளோம். இந்த நோக்கத்திற்காக அனைத்து வகையான மாற்றீடுகளின் பயன்பாடு (நூல் விளக்கங்கள், ஆவணங்களின் தேடல் படங்கள் மற்றும் அவற்றின் சுருக்கங்களின் உரைகள்) தேடலின் போது தகவல்களை இழக்க வழிவகுக்கும் என்பதால், அவற்றின் முழு உரைகளையும் பயன்படுத்தி ஆவணங்களைத் தேடுவதே இங்கு மிகவும் நம்பிக்கைக்குரியது. முதன்மை ஆவணங்களுக்கு மாற்றாக நூலியல் விளக்கங்கள் பயன்படுத்தப்படும்போது மிகப்பெரிய இழப்புகள் ஏற்படுகின்றன, மேலும் சுருக்கங்கள் பயன்படுத்தப்படும்போது மிகச்சிறிய இழப்புகள் ஏற்படுகின்றன.

முக்கியமான அம்சங்கள்தகவல் மீட்டெடுப்பின் தரம் அதன் முழுமை மற்றும் துல்லியம் ஆகும். மொழி மற்றும் பேச்சு அலகுகள் (சொற்கள் மற்றும் சொற்றொடர்கள்) மற்றும் துல்லியம் - அவற்றின் தொடரியல் இணைப்புகளை கணக்கில் எடுத்துக்கொள்வதன் மூலம் அதிகபட்ச முன்னுதாரண இணைப்புகளை எடுத்துக்கொள்வதன் மூலம் தேடலின் முழுமையை உறுதிப்படுத்த முடியும். தேடலின் முழுமையும் துல்லியமும் உள்ளதாக ஒரு கருத்து உள்ளது தலைகீழ் உறவு: இந்த குணாதிசயங்களில் ஒன்றை மேம்படுத்துவதற்கான நடவடிக்கைகள் மற்றொன்றின் சீரழிவுக்கு வழிவகுக்கும். ஆனால் இது நிலையான தேடல் தர்க்கத்திற்கு மட்டுமே பொருந்தும். இந்த தர்க்கம் மேம்படுத்தப்பட்டால், இரண்டு பண்புகளையும் ஒரே நேரத்தில் மேம்படுத்தலாம்.

பயனர் மற்றும் தகவல் மீட்டெடுப்பு அமைப்பு (IRS) ஆகியவற்றுக்கு இடையேயான ஊடாடும் தகவல்தொடர்பு செயல்முறையாக முழு-உரை தரவுத்தளங்களில் தகவலைத் தேடும் செயல்முறையை உருவாக்குவது நல்லது. கோரிக்கை, மற்றும் அவருக்கு பொருத்தமானவற்றைத் தேர்ந்தெடுக்கிறது. இறுதி தேடல் முடிவுகள் இவ்வாறு தோன்றலாம் முழு நூல்கள்ஆவணங்கள் மற்றும் அதன் துண்டுகள்.

முந்தைய விவாதங்களிலிருந்து காணக்கூடியது போல, தானாகவே தகவல்களைத் தேடும் போது, ​​உரைகளில் நிகழும் அதே அர்த்தத்தின் பல்வேறு வடிவங்களின் பிரதிநிதித்துவத்தின் காரணமாக பயனருக்கும் தகவல் அமைப்புக்கும் இடையே எழும் மொழித் தடையை கடக்க வேண்டியது அவசியம். பன்மொழி தரவுத்தளங்களில் தேடுதல் மேற்கொள்ளப்பட வேண்டும் என்றால் இந்த தடை இன்னும் குறிப்பிடத்தக்கதாகிறது. ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு ஆவண நூல்களை இயந்திர மொழிபெயர்ப்பதே இங்குள்ள சிக்கலுக்கு ஒரு தீவிரமான தீர்வு. இது முன்கூட்டியே, தேடுபொறியில் ஆவணங்களை ஏற்றுவதற்கு முன் அல்லது தகவலைத் தேடும் போது செய்யப்படலாம். பிந்தைய வழக்கில், பயனரின் கோரிக்கையானது தேடல் நடத்தப்படும் ஆவண வரிசையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும், மேலும் தேடல் முடிவுகள் கோரிக்கையின் மொழியில் மொழிபெயர்க்கப்பட வேண்டும். இந்த வகையான தேடுபொறிகள் ஏற்கனவே இணையத்தில் இயங்குகின்றன. VINITI RAS ஆனது ஒரு சிரிலிக் உலாவி அமைப்பையும் உருவாக்கியது, இது ரஷ்ய மொழி உரைகளில் உள்ள தகவல்களை ஆங்கிலத்தில் வினவல்களைப் பயன்படுத்தி பயனர் மொழியிலும் தேடல் முடிவுகளுடன் தேட அனுமதிக்கிறது.

கணினி மொழியியலின் முக்கியமான மற்றும் நம்பிக்கைக்குரிய பணியானது, இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் அறிவார்ந்த தானியங்கி தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளை உருவாக்குவதாகும். நவீன அறிவார்ந்த அமைப்புகளில் தகவல் முறைப்படுத்தப்பட்ட வடிவத்தில் சேமிக்கப்படுவதால், ஒரு நபருக்கும் கணினிக்கும் இடையில் இடைத்தரகர்களாக செயல்படும் மொழியியல் செயலிகள் பின்வரும் முக்கிய பணிகளைத் தீர்க்க வேண்டும்: 1) உள்ளீட்டு தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் உரையிலிருந்து இயற்கையான முறையில் மாற்றும் பணி ஒரு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் பொருளைக் குறிக்கும் மொழி (ஒரு கணினியில் தகவலை உள்ளிடும்போது); 2) வெளியீட்டுச் செய்திகளின் பொருளின் முறையான பிரதிநிதித்துவத்திலிருந்து இயற்கையான மொழியில் அதன் பிரதிநிதித்துவத்திற்கு (ஒரு நபருக்கு தகவலை வழங்கும்போது) மாற்றும் பணி. முதல் பணியானது உள்ளீட்டு வினவல்கள் மற்றும் செய்திகளின் உருவவியல், தொடரியல் மற்றும் கருத்தியல் பகுப்பாய்வு மூலம் தீர்க்கப்பட வேண்டும், இரண்டாவது - வெளியீட்டு செய்திகளின் கருத்தியல், தொடரியல் மற்றும் உருவவியல் தொகுப்பு மூலம்.

தகவல் கோரிக்கைகள் மற்றும் செய்திகளின் கருத்தியல் பகுப்பாய்வு அவற்றின் கருத்தியல் கட்டமைப்பை (கருத்துகளின் பெயர்களின் எல்லைகள் மற்றும் உரையில் உள்ள கருத்துக்களுக்கு இடையிலான உறவுகள்) அடையாளம் கண்டு, இந்த கட்டமைப்பை முறைப்படுத்தப்பட்ட மொழியில் மொழிபெயர்ப்பதைக் கொண்டுள்ளது. கோரிக்கைகள் மற்றும் செய்திகளின் உருவவியல் மற்றும் தொடரியல் பகுப்பாய்வுக்குப் பிறகு இது மேற்கொள்ளப்படுகிறது. செய்திகளின் கருத்தியல் தொகுப்பு முறைப்படுத்தப்பட்ட மொழியில் அவற்றின் கட்டமைப்பின் கூறுகளின் பிரதிநிதித்துவத்திலிருந்து வாய்மொழி (வாய்மொழி) பிரதிநிதித்துவத்திற்கு மாறுவதைக் கொண்டுள்ளது. இதற்குப் பிறகு, செய்திகளுக்கு தேவையான தொடரியல் மற்றும் உருவ வடிவம் வழங்கப்படுகிறது.

ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கு, கருத்துகளின் பெயர்களுக்கு இடையில் மொழிபெயர்ப்பு கடிதங்களின் அகராதிகளை வைத்திருப்பது அவசியம். இத்தகைய மொழிபெயர்ப்பு கடிதங்களைப் பற்றிய அறிவு பல தலைமுறை மக்களால் திரட்டப்பட்டது மற்றும் சிறப்பு வெளியீடுகள் - இருமொழி அல்லது பன்மொழி அகராதிகள் வடிவில் தொகுக்கப்பட்டது. வெளிநாட்டு மொழிகளைப் பற்றி ஓரளவு அறிந்த நிபுணர்களுக்கு, இந்த அகராதிகள் நூல்களை மொழிபெயர்ப்பதில் மதிப்புமிக்க உதவியாக இருந்தன.

பாரம்பரிய இருமொழி மற்றும் பன்மொழி பொது நோக்க அகராதிகளில், மொழிபெயர்ப்புச் சமமானவை முதன்மையாக தனிப்பட்ட சொற்களுக்கும், சொற்றொடர்களுக்கும் - மிகக் குறைவாகவே குறிப்பிடப்படுகின்றன. சொற்றொடருக்கான மொழிபெயர்ப்புச் சமமான குறிப்பானது சிறப்பு சொற்களஞ்சிய அகராதிகளுக்கு மிகவும் பொதுவானதாக இருந்தது. எனவே, பல சொற்களைக் கொண்ட நூல்களின் பகுதிகளை மொழிபெயர்க்கும்போது, ​​மாணவர்கள் பெரும்பாலும் சிரமங்களை எதிர்கொண்டனர்.

"பள்ளி" தலைப்புகளில் பல ஜோடி ஆங்கிலம் மற்றும் ரஷ்ய சொற்றொடர்களுக்கு இடையேயான மொழிபெயர்ப்பு கடிதங்கள் கீழே உள்ளன.

1) வௌவால் இறக்கைகள் கொண்ட எலி போல் தெரிகிறது - வௌவால் இறக்கைகள் கொண்ட எலி போல் தெரிகிறது.

2) குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள் - குழந்தைகள் கடற்கரையில் மணலில் விளையாட விரும்புகிறார்கள்.

3) ஒரு துளி மழை என் கையில் விழுந்தது - ஒரு துளி மழை என் கையில் விழுந்தது.

4) உலர்ந்த மரம் எளிதில் எரிகிறது - உலர்ந்த மரம் நன்றாக எரிகிறது.

5) அவர் என்னைக் கேட்காதது போல் நடித்தார் - அவர் என்னைக் கேட்காதது போல் நடித்தார்.

இங்கே ஆங்கில சொற்றொடர்கள் idiomatic வெளிப்பாடுகள் அல்ல. எவ்வாறாயினும், ரஷ்ய மொழியில் அவற்றின் மொழிபெயர்ப்பு ஒரு எளிய வார்த்தைக்கு வார்த்தை மொழிபெயர்ப்பாக மட்டுமே கருதப்படும், ஏனெனில் அவற்றில் சேர்க்கப்பட்டுள்ள அனைத்து சொற்களும் தெளிவற்றவை. எனவே, கணினி மொழியியல் சாதனைகள் மட்டுமே இங்கு மாணவர்களுக்கு உதவும்.

அறிமுகம்

கணக்கீட்டு மொழியியல் என்றால் என்ன?

கணினி மொழியியல் , பயன்பாட்டு மொழியியலில் ஒரு திசை, கணினி கருவிகளின் பயன்பாட்டில் கவனம் செலுத்துகிறது - நிரல்கள், தரவை ஒழுங்கமைப்பதற்கும் செயலாக்குவதற்கும் கணினி தொழில்நுட்பங்கள் - சில நிபந்தனைகள், சூழ்நிலைகள், சிக்கல் பகுதிகள் போன்றவற்றில் மொழியின் செயல்பாட்டை மாதிரியாக்க, அத்துடன் முழு நோக்கமும் மொழியியல் மற்றும் தொடர்புடைய துறைகளில் மொழியின் கணினி மாதிரிகளின் பயன்பாடு. உண்மையில், பிந்தைய வழக்கில் மட்டுமே நாம் கடுமையான அர்த்தத்தில் பயன்பாட்டு மொழியியல் பற்றி பேசுகிறோம், ஏனெனில் மொழியின் கணினி மாடலிங் கணினி அறிவியல் மற்றும் மொழி அறிவியலில் உள்ள சிக்கல்களைத் தீர்ப்பதற்கான நிரலாக்கக் கோட்பாட்டின் பயன்பாட்டின் ஒரு துறையாகவும் கருதப்படலாம். எவ்வாறாயினும், நடைமுறையில், கணக்கீட்டு மொழியியல் என்பது மொழியியலில் கணினிகளின் பயன்பாடு தொடர்பான அனைத்தையும் உள்ளடக்கியது.

கணக்கீட்டு மொழியியல் 1960 களில் ஒரு சிறப்பு அறிவியல் துறையாக வடிவம் பெற்றது. "கணினி மொழியியல்" என்ற ரஷ்ய சொல் ஆங்கில கணக்கீட்டு மொழியியலில் இருந்து மொழிபெயர்க்கப்பட்டுள்ளது. ரஷ்ய மொழியில் கணக்கீட்டு என்ற பெயரடை "கணக்கீடு" என்றும் மொழிபெயர்க்கப்படலாம் என்பதால், "கணக்கீட்டு மொழியியல்" என்ற சொல் இலக்கியத்திலும் காணப்படுகிறது, ஆனால் ரஷ்ய அறிவியலில் இது "அளவு மொழியியல்" என்ற கருத்தை அணுகும் ஒரு குறுகிய பொருளைப் பெறுகிறது. இந்த பகுதியில் வெளியீடுகளின் ஓட்டம் மிகவும் பெரியது. கருப்பொருள் தொகுப்புகளுக்கு கூடுதலாக, கணினி மொழியியல் இதழ் அமெரிக்காவில் காலாண்டுக்கு ஒருமுறை வெளியிடப்படுகிறது. பெரிய நிறுவன மற்றும் அறிவியல் வேலைகணக்கீட்டு மொழியியல் சங்கத்தால் நடத்தப்படுகிறது பிராந்திய கட்டமைப்புகள்(குறிப்பாக, ஐரோப்பிய கிளை). ஒவ்வொரு இரண்டு வருடங்களுக்கும், கணக்கீட்டு மொழியியல் பற்றிய சர்வதேச மாநாடுகள் - COLING - நடத்தப்படுகின்றன. செயற்கை நுண்ணறிவு பற்றிய பல்வேறு மாநாடுகளில் தொடர்புடைய சிக்கல்கள் பொதுவாக பரவலாக குறிப்பிடப்படுகின்றன.

பணிகள்

கணக்கீட்டு மொழியியல் மொழி செயல்பாட்டின் கணினி மாதிரியாக்கத்தின் உண்மையான மொழியியல் சிக்கல்களை எடுத்துக்கொள்கிறது. அதன் நோக்கங்கள் மிகவும் துல்லியமான மற்றும் முழுமையான மொழியியல் மாதிரிகள் மற்றும் மேம்பட்ட பகுப்பாய்வு மற்றும் தொகுப்பு வழிமுறைகளை உருவாக்குவதாகும்.

முக்கிய திசைகளை அடையாளம் காணலாம்:

1) மனிதனுக்கும் கணினிக்கும் இடையிலான தொடர்பு: கட்டுப்பாடு - நிரலாக்க மொழிகள், தகவல் பரிமாற்றம் - இடைமுகம்.

2) உரைகளுடன் பணிபுரிதல்: அட்டவணைப்படுத்தல், பகுப்பாய்வு மற்றும் வகைப்பாடு, தானியங்கி எடிட்டிங் (பிழை திருத்தம்), அறிவு அடையாளம், இயந்திர மொழிபெயர்ப்பு.

கதை

70களில் உருவாக்கப்பட்ட ஆரம்பகால அமெரிக்க அமைப்புகளான LIFER (Language Interface Facility wich Elipsis and Recursion) மூலம் தரவுத்தளங்களை அணுகுவதற்கான ஆங்கில மொழியின் துணைக்குழுவின் எளிய தலைமுறை வழங்கப்பட்டது. அதைத் தொடர்ந்து, மற்ற, மிகவும் நெகிழ்வான அமைப்புகள் கணினி சந்தையில் தோன்றின, இது ஒரு கணினியுடன் வரையறுக்கப்பட்ட இயற்கை மொழி இடைமுகத்தை வழங்குகிறது.

80 களில், தரவுத்தளங்கள் மற்றும் நிபுணர் அமைப்புகளுடன் இயற்கையான மொழி இடைமுகங்களின் வளர்ச்சி மற்றும் விற்பனையில் ஈடுபட்டுள்ள பல நிறுவனங்கள் அமெரிக்காவில் உருவாக்கப்பட்டன. 1985 இல் Semantek கார்ப்பரேஷன் அத்தகைய Q&A மென்பொருள் தொகுப்பை வழங்கியது, மேலும் Carnegie Group நிறுவனம் இதே போன்ற LanguageCraft தொகுப்பை வழங்கியது.

தானியங்கி மொழிபெயர்ப்பு அமைப்புகளை உருவாக்கும் பணி தீவிரமாக நடந்து வருகிறது. அமெரிக்க விமானப்படைக்காக டி.டாம் தலைமையில் உருவாக்கப்பட்ட தானியங்கி மொழிபெயர்ப்பு அமைப்பு SYSTRAN பரவலாகிவிட்டது. 1974 - 1975 காலகட்டத்தில் அப்பல்லோ-சோயுஸ் திட்டத்திற்கான ஆவணங்களை மொழிபெயர்க்க நாசா விண்வெளி சங்கத்தால் இந்த அமைப்பு பயன்படுத்தப்பட்டது. இப்போதெல்லாம், அவர் பல மொழிகளில் இருந்து ஆண்டுதோறும் சுமார் 100,000 பக்கங்களை மொழிபெயர்க்கிறார்.

ஐரோப்பாவில், கணினி மொழிபெயர்ப்பு அமைப்புகளை உருவாக்கும் பணி ஐரோப்பிய தகவல் வலையமைப்பின் (EURONET DIANA) உருவாக்கத்தால் தூண்டப்பட்டது. 1982 ஆம் ஆண்டில், ஐரோப்பிய பொருளாதார சமூகம் EUROTRA என்ற ஐரோப்பிய நிரலை உருவாக்குவதாக அறிவித்தது, இதன் குறிக்கோள் அனைத்து ஐரோப்பிய மொழிகளுக்கும் கணினி உதவி மொழிபெயர்ப்பு முறையை உருவாக்குவதாகும். இந்த திட்டம் 1987 இல் $12 மில்லியனாக மதிப்பிடப்பட்டது, வல்லுநர்கள் இந்த திட்டத்தின் மொத்த செலவை $160 மில்லியனுக்கும் அதிகமாக நிர்ணயம் செய்தனர்.

ஜப்பானில், 1981 இல் அறிவிக்கப்பட்ட நாடு தழுவிய ஐந்தாம் தலைமுறை கணினி நிரலைச் சுற்றியுள்ள கணக்கீட்டு மொழியியல் மையங்களில் ஆராய்ச்சி.

இயற்கையான மொழியில் மனித-இயந்திர இடைமுகங்களை உருவாக்க பல இராணுவ திட்டங்கள் உள்ளன. யுனைடெட் ஸ்டேட்ஸில், அவை முக்கியமாக மூலோபாய கணினி முன்முயற்சியின் கட்டமைப்பிற்குள் மேற்கொள்ளப்படுகின்றன, இது 1983 இல் பாதுகாப்புத் துறையால் ஏற்றுக்கொள்ளப்பட்ட பத்தாண்டு திட்டமாகும். புதிய தலைமுறை "புத்திசாலித்தனமான" ஆயுதங்கள் மற்றும் இராணுவ அமைப்புகளை உருவாக்குவதே இதன் குறிக்கோள். அமெரிக்காவின் நீண்ட கால தொழில்நுட்ப மேன்மையை உறுதிப்படுத்தும் பொருட்டு.

இயற்கையாகவே, கணினிகள் மற்றும் நிரலாக்க மொழிகளில் நன்கு அறிந்த செயற்கை நுண்ணறிவு வல்லுநர்கள், தங்கள் சொந்த முறைகளைப் பயன்படுத்தி மொழியைப் புரிந்துகொள்வதில் உள்ள சிக்கலை ஆற்றலுடன் தீர்க்கத் தொடங்கினர். இயற்கை மொழி அல்காரிதம்களுக்கான தேடல் இருந்தது. மிகவும் குறுகிய சிறப்புப் பகுதிகளுக்கு சிக்கலான மொழிப் புரிதல் திட்டங்கள் உருவாக்கப்பட்டுள்ளன, பகுதி இயந்திர மொழிபெயர்ப்பு திட்டங்கள் மற்றும் பல செயல்படுத்தப்பட்டுள்ளன. ஆனால் மொழியைப் புரிந்துகொள்வதில் உள்ள சிக்கலைத் தீர்ப்பதில் தீர்க்கமான முன்னேற்றம் இல்லை. மொழியும் மக்களும் மிகவும் இணைக்கப்பட்டுள்ளனர், விஞ்ஞானிகள் உலகத்தைப் பற்றிய மனித புரிதலின் சிக்கலைச் சமாளிக்க வேண்டியிருந்தது. இது ஏற்கனவே தத்துவத்தின் பகுதி.

மொழியியலின் அடிப்படைக் கருத்துக்கள்

பாடப் பணி

"தகவல்" துறையில்

தலைப்பில்: "கணக்கீட்டு மொழியியல்"


அறிமுகம்

1. மொழியியல் ஆராய்ச்சியில் கணக்கீட்டு மொழியியலின் இடம் மற்றும் பங்கு

2. கணக்கீட்டு மொழியியலுக்கான நவீன இடைமுகங்கள்

முடிவுரை

இலக்கியம்


அறிமுகம்

நவீன சமூகத்தின் வாழ்க்கையில் தானியங்கி தகவல் தொழில்நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன. காலப்போக்கில், அவற்றின் முக்கியத்துவம் தொடர்ந்து அதிகரிக்கிறது. ஆனால் தகவல் தொழில்நுட்பத்தின் வளர்ச்சி மிகவும் சீரற்றது: கணினி தொழில்நுட்பம் மற்றும் தகவல்தொடர்புகளின் நவீன நிலை ஆச்சரியமாக இருந்தால், தகவலின் சொற்பொருள் செயலாக்கத் துறையில், வெற்றிகள் மிகவும் மிதமானவை. இந்த வெற்றிகள் முதலில், மனித சிந்தனையின் செயல்முறைகள், மக்களிடையே வாய்மொழி தகவல்தொடர்பு செயல்முறைகள் மற்றும் கணினியில் இந்த செயல்முறைகளை உருவகப்படுத்தும் திறன் ஆகியவற்றின் ஆய்வில் சாதனைகள் சார்ந்தது.

நம்பிக்கைக்குரிய தகவல் தொழில்நுட்பங்களை உருவாக்கும் போது, ​​​​இயற்கை மொழிகளில் வழங்கப்படும் உரைத் தகவல்களை தானாக செயலாக்குவதில் சிக்கல்கள் முன்னுக்கு வருகின்றன. ஒரு நபரின் சிந்தனை அவரது மொழியுடன் நெருக்கமாக இணைக்கப்பட்டுள்ளது என்பதன் மூலம் இது தீர்மானிக்கப்படுகிறது. மேலும், இயற்கை மொழி சிந்திக்கும் கருவியாகும். இது மக்களிடையே தகவல்தொடர்புக்கான உலகளாவிய வழிமுறையாகும் - தகவல்களின் கருத்து, குவிப்பு, சேமிப்பு, செயலாக்கம் மற்றும் பரிமாற்றத்திற்கான ஒரு வழிமுறையாகும். கணினி மொழியியல் அறிவியல் தானியங்கி தகவல் செயலாக்க அமைப்புகளில் இயற்கை மொழியைப் பயன்படுத்துவதில் உள்ள சிக்கல்களைக் கையாள்கிறது. இந்த விஞ்ஞானம் ஒப்பீட்டளவில் சமீபத்தில் எழுந்தது - கடந்த நூற்றாண்டின் ஐம்பதுகள் மற்றும் அறுபதுகளின் தொடக்கத்தில். கடந்த அரை நூற்றாண்டில், கணினி மொழியியல் துறையில் குறிப்பிடத்தக்க அறிவியல் மற்றும் நடைமுறை முடிவுகள் பெறப்பட்டுள்ளன: ஒரு இயற்கை மொழியிலிருந்து மற்றொன்றுக்கு நூல்களை இயந்திர மொழிபெயர்ப்பதற்கான அமைப்புகள், உரைகளில் தானியங்கு தகவல்களை மீட்டெடுப்பதற்கான அமைப்புகள், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி தொகுப்புக்கான அமைப்புகள். பேச்சு, மற்றும் பல உருவாக்கப்பட்டுள்ளன. மொழியியல் ஆராய்ச்சியின் போது கணினி மொழியியலைப் பயன்படுத்தி உகந்த கணினி இடைமுகத்தை உருவாக்குவதற்கு இந்த வேலை அர்ப்பணிக்கப்பட்டுள்ளது.


நவீன உலகில், பல்வேறு மொழியியல் ஆய்வுகளை நடத்துவதற்கு கணக்கீட்டு மொழியியல் அதிகளவில் பயன்படுத்தப்படுகிறது.

கணக்கீட்டு மொழியியல் என்பது இயற்கையான மொழியில் வழங்கப்பட்ட தகவல்களை தானியங்கு செயலாக்கத்தின் சிக்கல்களைத் தீர்ப்பதோடு தொடர்புடைய அறிவுத் துறையாகும். கணினி மொழியியலின் மைய அறிவியல் சிக்கல்கள், உரைகளின் பொருளைப் புரிந்துகொள்ளும் செயல்முறையை மாதிரியாக்குவது (உரையிலிருந்து அதன் அர்த்தத்தின் முறைப்படுத்தப்பட்ட பிரதிநிதித்துவத்திற்கு மாறுதல்) மற்றும் பேச்சுத் தொகுப்பின் சிக்கல் (இயற்கையில் உள்ள உரைகளுக்கு முறைப்படுத்தப்பட்ட அர்த்தத்திலிருந்து மாறுதல் மொழி). பல பயன்பாட்டு சிக்கல்களைத் தீர்க்கும்போது இந்த சிக்கல்கள் எழுகின்றன, குறிப்பாக, கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைத் தானாகக் கண்டறிதல் மற்றும் சரிசெய்தல், தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்பு, ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் தானியங்கி மொழிபெயர்ப்பு, தொடர்பு இயற்கை மொழியில் உள்ள கணினி, உரை ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் அட்டவணைப்படுத்தல், அவற்றின் தானியங்கி சுருக்கம், முழு உரை தரவுத்தளங்களில் ஆவணங்களைத் தேடுதல்.

கணக்கீட்டு மொழியியலில் உருவாக்கப்பட்ட மற்றும் பயன்படுத்தப்படும் மொழியியல் கருவிகளை இரண்டு பகுதிகளாகப் பிரிக்கலாம்: அறிவிப்பு மற்றும் நடைமுறை. அறிவிப்புப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகளின் அகராதிகள், உரைகள் மற்றும் பல்வேறு வகையான இலக்கண அட்டவணைகள் உள்ளன, நடைமுறைப் பகுதியில் மொழி மற்றும் பேச்சு அலகுகள், உரைகள் மற்றும் இலக்கண அட்டவணைகள் ஆகியவற்றைக் கையாளும் வழிமுறைகள் அடங்கும். கணினி இடைமுகம் என்பது கணக்கீட்டு மொழியியலின் செயல்முறைப் பகுதியைக் குறிக்கிறது.

கணினி மொழியியலின் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் வெற்றி, முதலில், கணினி நினைவகத்தில் அறிவிப்பு வழிமுறைகளின் பிரதிநிதித்துவத்தின் முழுமை மற்றும் துல்லியம் மற்றும் நடைமுறை வழிமுறைகளின் தரம் ஆகியவற்றைப் பொறுத்தது. உலகின் அனைத்து வளர்ந்த நாடுகளிலும் (ரஷ்யா, அமெரிக்கா, இங்கிலாந்து, பிரான்ஸ், ஜெர்மனி, ஜப்பான், முதலியன) கணக்கீட்டு மொழியியல் துறையில் பணிகள் மேற்கொள்ளப்பட்டாலும், இன்றுவரை, இந்த சிக்கல்களைத் தீர்ப்பதற்கான தேவையான அளவு இன்னும் அடையப்படவில்லை. )

ஆயினும்கூட, கணக்கீட்டு மொழியியல் துறையில் தீவிர அறிவியல் மற்றும் நடைமுறை சாதனைகளைக் குறிப்பிடலாம். இவ்வாறு, பல நாடுகளில் (ரஷ்யா, அமெரிக்கா, ஜப்பான், முதலியன) ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களை இயந்திர மொழிபெயர்ப்பிற்கான சோதனை மற்றும் தொழில்துறை அமைப்புகள் உருவாக்கப்பட்டுள்ளன, இயற்கை மொழியில் கணினிகளுடன் தொடர்புகொள்வதற்கான பல சோதனை அமைப்புகள் கட்டமைக்கப்பட்டுள்ளன. , டெர்மினாலாஜிக்கல் தரவு வங்கிகள், சொற்களஞ்சியம், இருமொழி மற்றும் பன்மொழி இயந்திர அகராதிகளை (ரஷ்யா, அமெரிக்கா, ஜெர்மனி, பிரான்ஸ், முதலியன) உருவாக்கும் பணி நடந்து வருகிறது, தானியங்கி பகுப்பாய்வு மற்றும் வாய்வழி பேச்சின் தொகுப்புக்கான அமைப்புகள் கட்டமைக்கப்படுகின்றன (ரஷ்யா, அமெரிக்கா, ஜப்பான் போன்றவை. .), இயற்கை மொழி மாதிரிகளை உருவாக்கும் துறையில் ஆராய்ச்சி நடத்தப்படுகிறது.

பயன்பாட்டு கணக்கீட்டு மொழியியலின் ஒரு முக்கியமான வழிமுறை சிக்கல், தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு மற்றும் செயல்முறை கூறுகளுக்கு இடையே தேவையான உறவின் சரியான மதிப்பீடு ஆகும். எது விரும்பப்பட வேண்டும்: வளமான இலக்கண மற்றும் சொற்பொருள் தகவல்களுடன் ஒப்பீட்டளவில் சிறிய சொற்களஞ்சிய அமைப்புகளை அடிப்படையாகக் கொண்ட சக்திவாய்ந்த கணக்கீட்டு நடைமுறைகள் அல்லது ஒப்பீட்டளவில் எளிமையான கணினி இடைமுகங்களைக் கொண்ட சக்திவாய்ந்த அறிவிப்பு கூறு? பெரும்பாலான விஞ்ஞானிகள் இரண்டாவது வழி விரும்பத்தக்கது என்று நம்புகிறார்கள். இது நடைமுறை இலக்குகளை விரைவாக அடைய வழிவகுக்கும், ஏனெனில் குறைவான முட்டுக்கட்டைகள் மற்றும் கடக்க கடினமான தடைகள் இருக்கும், மேலும் இங்கு ஆராய்ச்சி மற்றும் மேம்பாட்டை தானியக்கமாக்குவதற்கு கணினிகளை பெரிய அளவில் பயன்படுத்த முடியும்.

தானியங்கி உரை தகவல் செயலாக்க அமைப்புகளின் அறிவிப்பு கூறுகளை உருவாக்குவதற்கான முயற்சிகளை அணிதிரட்ட வேண்டிய அவசியம், கணினி மொழியியல் வளர்ச்சியில் அரை நூற்றாண்டு அனுபவத்தால் உறுதிப்படுத்தப்பட்டுள்ளது. எல்லாவற்றிற்கும் மேலாக, இங்கே, இந்த அறிவியலின் மறுக்க முடியாத வெற்றிகள் இருந்தபோதிலும், அல்காரிதம் நடைமுறைகளுக்கான ஆர்வம் எதிர்பார்த்த வெற்றியைக் கொண்டுவரவில்லை. நடைமுறை வழிமுறைகளின் திறன்களில் சில ஏமாற்றம் கூட இருந்தது.

மேற்கூறியவற்றின் வெளிச்சத்தில், கணினி மொழியியலின் வளர்ச்சிக்கான அத்தகைய பாதையை உருவாக்குவது உறுதியளிக்கிறது, முக்கிய முயற்சிகள் மொழி மற்றும் பேச்சு அலகுகளின் சக்திவாய்ந்த அகராதிகளை உருவாக்குதல், அவற்றின் சொற்பொருள்-தொடரியல் கட்டமைப்பை ஆய்வு செய்தல் மற்றும் உருவவியல் அடிப்படை நடைமுறைகளை உருவாக்குதல், சொற்பொருள்-தொடக்கவியல் மற்றும் கருத்தியல் பகுப்பாய்வு மற்றும் உரைகளின் தொகுப்பு. இது எதிர்காலத்தில் பரவலான பயன்பாட்டு சிக்கல்களைத் தீர்க்க அனுமதிக்கும்.

கணினி மொழியியல், முதலில், தகவல்களைச் சேகரித்தல், குவித்தல், செயலாக்குதல் மற்றும் மீட்டெடுப்பதற்கான செயல்முறைகளுக்கான மொழியியல் ஆதரவின் பணிகளை எதிர்கொள்கிறது. அவற்றில் மிக முக்கியமானவை:

1. இயந்திர அகராதிகளின் தொகுத்தல் மற்றும் மொழியியல் செயலாக்கத்தின் ஆட்டோமேஷன்;

2. கணினியில் உரைகளை உள்ளிடும்போது பிழைகளைக் கண்டறிந்து திருத்தும் செயல்முறைகளின் ஆட்டோமேஷன்;

3. ஆவணங்கள் மற்றும் தகவல் கோரிக்கைகளின் தானியங்கி அட்டவணைப்படுத்தல்;

4. ஆவணங்களின் தானியங்கு வகைப்பாடு மற்றும் சுருக்கம்;

5. ஒருமொழி மற்றும் பன்மொழி தரவுத்தளங்களில் தகவல் மீட்டெடுப்பு செயல்முறைகளுக்கான மொழியியல் ஆதரவு;

6. ஒரு இயற்கை மொழியிலிருந்து மற்றொரு மொழிக்கு நூல்களின் இயந்திர மொழிபெயர்ப்பு;

7. தானியங்கி அறிவார்ந்த தகவல் அமைப்புகளுடன் (குறிப்பாக, நிபுணர் அமைப்புகள்) இயற்கையான மொழியில் அல்லது இயற்கைக்கு நெருக்கமான மொழியில் பயனர் தொடர்புகளை உறுதி செய்யும் மொழியியல் செயலிகளின் கட்டுமானம்;

8. முறைசாரா நூல்களிலிருந்து உண்மைத் தகவல்களைப் பிரித்தெடுத்தல்.

ஆராய்ச்சியின் தலைப்புக்கு மிகவும் பொருத்தமான சிக்கல்களில் விரிவாக வாழ்வோம்.

தகவல் மையங்களின் நடைமுறை நடவடிக்கைகளில், தானாக கண்டறிதல் மற்றும் உரைகளில் உள்ள பிழைகளை கணினியில் உள்ளிடும்போது அவற்றை சரிசெய்தல் ஆகியவற்றின் சிக்கலை தீர்க்க வேண்டிய அவசியம் உள்ளது. இந்த சிக்கலான பணியை நிபந்தனையுடன் மூன்று பணிகளாகப் பிரிக்கலாம் - உரைகளின் எழுத்து, தொடரியல் மற்றும் சொற்பொருள் கட்டுப்பாடு. அவற்றில் முதன்மையானது, சொல் தண்டுகளின் மிகவும் சக்திவாய்ந்த குறிப்பு இயந்திர அகராதியைப் பயன்படுத்தும் உருவவியல் பகுப்பாய்வு செயல்முறையைப் பயன்படுத்தி தீர்க்கப்படலாம். எழுத்துப்பிழைக் கட்டுப்பாட்டின் செயல்பாட்டில், உரையின் சொற்கள் உருவவியல் பகுப்பாய்விற்கு உட்பட்டவை, மேலும் அவற்றின் அடிப்படைகள் குறிப்பு அகராதியின் அடிப்படைகளுடன் அடையாளம் காணப்பட்டால், அவை சரியானதாகக் கருதப்படுகின்றன; அவை அடையாளம் காணப்படவில்லை என்றால், அவை, ஒரு நுண்ணிய சூழலுடன் சேர்ந்து, ஒரு நபருக்கு பார்வைக்காக வழங்கப்படுகின்றன. ஒரு நபர் சிதைந்த சொற்களைக் கண்டறிந்து திருத்துகிறார், மேலும் தொடர்புடைய மென்பொருள் அமைப்பு இந்த திருத்தங்களை திருத்தப்பட்ட உரையாக மாற்றுகிறது.

எழுத்துப்பிழைகளைக் கண்டறிவதற்காக உரைகளின் தொடரியல் கட்டுப்பாட்டின் பணி எழுத்துப்பிழைக் கட்டுப்பாட்டின் பணியை விட மிகவும் கடினம். முதலாவதாக, அதன் கலவையில் எழுத்துப்பிழைக் கட்டுப்பாட்டை அதன் கட்டாய அங்கமாக உள்ளடக்கியிருப்பதால், இரண்டாவதாக, முறைசாரா நூல்களின் தொடரியல் பகுப்பாய்வின் சிக்கல் இன்னும் முழுமையாக தீர்க்கப்படவில்லை. இருப்பினும், உரைகளின் பகுதி தொடரியல் கட்டுப்பாடு மிகவும் சாத்தியம். இங்கே நீங்கள் இரண்டு வழிகளில் செல்லலாம்: குறிப்பு தொடரியல் கட்டமைப்புகளின் மிகவும் பிரதிநிதித்துவ இயந்திர அகராதிகளைத் தொகுக்கவும் மற்றும் பகுப்பாய்வு செய்யப்பட்ட உரையின் தொடரியல் கட்டமைப்புகளை அவற்றுடன் ஒப்பிடவும்; அல்லது உரை கூறுகளின் இலக்கண நிலைத்தன்மையை சரிபார்க்க சிக்கலான விதிகளை உருவாக்கவும். முதல் பாதை எங்களுக்கு மிகவும் நம்பிக்கைக்குரியதாகத் தோன்றுகிறது, இருப்பினும் இது இரண்டாவது பாதையின் கூறுகளைப் பயன்படுத்துவதற்கான வாய்ப்பை விலக்கவில்லை. உரைகளின் தொடரியல் அமைப்பு வார்த்தைகளின் இலக்கண வகுப்புகளின் அடிப்படையில் விவரிக்கப்பட வேண்டும் (இன்னும் துல்லியமாக, சொற்களுக்கான இலக்கண தகவல்களின் தொகுப்புகளின் வரிசைகளின் வடிவத்தில்).

சொற்பொருள் பிழைகளைக் கண்டறிவதற்காக நூல்களின் சொற்பொருள் கட்டுப்பாட்டின் பணி செயற்கை நுண்ணறிவு பணிகளின் வகுப்பாக வகைப்படுத்தப்பட வேண்டும். மனித சிந்தனையின் செயல்முறைகளை மாதிரியாக்குவதன் அடிப்படையில் மட்டுமே இது முழுமையாக தீர்க்கப்பட முடியும். இந்த வழக்கில், அறிவு கையாளுதலுக்கான சக்திவாய்ந்த கலைக்களஞ்சிய அறிவுத் தளங்கள் மற்றும் மென்பொருள் கருவிகளை உருவாக்குவது அவசியமாக இருக்கும். இருப்பினும், வரையறுக்கப்பட்ட பாடப் பகுதிகள் மற்றும் முறைப்படுத்தப்பட்ட தகவல்களுக்கு, இந்த பணி முற்றிலும் தீர்க்கக்கூடியது. இது உரைகளின் சொற்பொருள்-தொடக்கக் கட்டுப்பாட்டின் சிக்கலாக முன்வைக்கப்பட்டு தீர்க்கப்பட வேண்டும்.

மொழியியல் துறையில் உயர்நிலைப் பள்ளிபொருளாதாரம், கணக்கீட்டு மொழியியலுக்கு அர்ப்பணிக்கப்பட்ட ஒரு புதிய முதுகலை திட்டம் தொடங்கப்படுகிறது: மனிதநேயம் மற்றும் கணிதத்தில் அடிப்படைக் கல்வி பெற்ற விண்ணப்பதாரர்கள் மற்றும் அறிவியலின் மிகவும் நம்பிக்கைக்குரிய கிளைகளில் ஒன்றில் சிக்கல்களைத் தீர்ப்பதில் ஆர்வமுள்ள எவரையும் இது வரவேற்கிறது. அதன் இயக்குனர், அனஸ்தேசியா போன்ச்-ஓஸ்மோலோவ்ஸ்காயா, தியரிகள் மற்றும் பயிற்சியாளர்களிடம் கணக்கீட்டு மொழியியல் என்றால் என்ன, ரோபோக்கள் ஏன் மனிதர்களை மாற்றாது, மற்றும் கணக்கீட்டு மொழியியலில் HSE மாஸ்டர் திட்டத்தில் என்ன கற்பிக்கப்படும் என்று கூறினார்.

இந்த திட்டம் ரஷ்யாவில் கிட்டத்தட்ட ஒரே மாதிரியான ஒன்றாகும். நீ எங்கு படித்தாய்?

நான் மாஸ்கோ மாநில பல்கலைக்கழகத்தில் தத்துவார்த்த துறையில் படித்தேன் பயன்பாட்டு மொழியியல்மொழியியல் பீடம். நான் இப்போதே அங்கு வரவில்லை, முதலில் நான் ரஷ்ய துறையில் நுழைந்தேன், ஆனால் பின்னர் நான் மொழியியலில் தீவிரமாக ஆர்வம் காட்டினேன், இன்றுவரை அந்தத் துறையில் இருக்கும் சூழ்நிலையால் நான் ஈர்க்கப்பட்டேன். மிக முக்கியமான விஷயம் ஆசிரியர்களுக்கும் மாணவர்களுக்கும் இடையே நல்ல தொடர்பு மற்றும் அவர்களின் பரஸ்பர நலன்.

எனக்கு குழந்தைகள் பிறந்து, வருமானம் ஈட்ட வேண்டிய நிலையில், வணிக மொழியியல் துறையில் இறங்கினேன். 2005 ஆம் ஆண்டில், இந்த செயல்பாடு என்ன என்பது தெளிவாகத் தெரியவில்லை. நான் வெவ்வேறு மொழியியல் நிறுவனங்களில் பணிபுரிந்தேன்: நான் Public.ru தளத்தில் ஒரு சிறிய நிறுவனத்துடன் தொடங்கினேன் - இது ஒரு வகையான ஊடக நூலகம், அங்கு நான் மொழியியல் தொழில்நுட்பங்களில் பணியாற்றத் தொடங்கினேன். பின்னர் நான் Rosnanotech இல் ஒரு வருடம் பணிபுரிந்தேன், அங்கு ஒரு பகுப்பாய்வு போர்ட்டலை உருவாக்க ஒரு யோசனை இருந்தது, அதில் உள்ள தரவு தானாகவே கட்டமைக்கப்படும். பின்னர் நான் அவிகாம்ப் நிறுவனத்தில் மொழியியல் துறைக்கு தலைமை தாங்கினேன் - இது ஏற்கனவே கணினி மொழியியல் மற்றும் சொற்பொருள் தொழில்நுட்பத் துறையில் ஒரு தீவிர தயாரிப்பு ஆகும். அதே நேரத்தில், நான் மாஸ்கோ மாநில பல்கலைக்கழகத்தில் கணக்கீட்டு மொழியியல் பாடத்தை கற்பித்தேன், மேலும் அதை நவீனமாக்க முயற்சித்தேன்.

ஒரு மொழியியலாளர் இரண்டு ஆதாரங்கள்: - ரஷ்ய மொழி தொடர்பான அறிவியல் மற்றும் பயன்பாட்டு ஆராய்ச்சிக்காக மொழியியலாளர்களால் உருவாக்கப்பட்ட தளம். இது ரஷ்ய மொழியின் மாதிரியாகும், இது பல்வேறு வகைகள் மற்றும் காலகட்டங்களிலிருந்து ஒரு பெரிய வரிசை நூல்களைப் பயன்படுத்தி வழங்கப்படுகிறது. நூல்கள் மொழியியல் மார்க்அப்புடன் பொருத்தப்பட்டுள்ளன, இதன் உதவியுடன் நீங்கள் சில மொழியியல் நிகழ்வுகளின் அதிர்வெண் பற்றிய தகவல்களைப் பெறலாம். வேர்ட்நெட் - ஒரு பெரிய லெக்சிக்கல் தரவுத்தளம் ஆங்கிலத்தில், வேர்ட்நெட்டின் முக்கிய யோசனை வார்த்தைகளை அல்ல, ஆனால் அவற்றின் அர்த்தங்களை ஒரு பெரிய நெட்வொர்க்கில் இணைப்பதாகும். Wordnet ஐ பதிவிறக்கம் செய்து உங்கள் சொந்த திட்டங்களுக்கு பயன்படுத்தலாம்.

கணக்கீட்டு மொழியியல் என்ன செய்கிறது?

இது மிகவும் இடைநிலைத் துறையாகும். எலக்ட்ரானிக் உலகில் என்ன நடக்கிறது மற்றும் குறிப்பிட்ட விஷயங்களைச் செய்ய உங்களுக்கு யார் உதவுவார்கள் என்பதைப் புரிந்துகொள்வது இங்கே மிக முக்கியமான விஷயம்.

நாங்கள் மிகவும் சூழப்பட்டுள்ளோம் ஒரு பெரிய எண்ணிக்கைடிஜிட்டல் தகவல், பல வணிகத் திட்டங்கள் உள்ளன, அவற்றின் வெற்றி தகவல் செயலாக்கத்தைப் பொறுத்தது, இந்தத் திட்டங்கள் சந்தைப்படுத்தல், அரசியல், பொருளாதாரம் மற்றும் வேறு எதையும் தொடர்புபடுத்தலாம். இந்த தகவலை திறம்பட கையாள்வது மிகவும் முக்கியம் - முக்கிய விஷயம், தகவலை செயலாக்கும் வேகம் மட்டுமல்ல, சத்தத்தை வடிகட்டிய பிறகு, உங்களுக்குத் தேவையான தரவைப் பெற்று, முழுமையானதை உருவாக்கவும் முடியும். அதிலிருந்து படம்.

முன்னதாக, சில உலகளாவிய யோசனைகள் கணினி மொழியியலுடன் தொடர்புடையவை, எடுத்துக்காட்டாக: இயந்திர மொழிபெயர்ப்பு மனித மொழிபெயர்ப்பை மாற்றும், மக்களுக்கு பதிலாக ரோபோக்கள் வேலை செய்யும் என்று மக்கள் நினைத்தார்கள். ஆனால் இப்போது அது ஒரு கற்பனாவாதம் போல் தெரிகிறது, மேலும் இயந்திர மொழிபெயர்ப்பு பயன்படுத்தப்படுகிறது தேடல் இயந்திரங்கள்அறிமுகமில்லாத மொழியில் விரைவான தேடல்களுக்கு. அதாவது, இப்போது மொழியியல் அரிதாகவே சுருக்க சிக்கல்களைக் கையாள்கிறது - பெரும்பாலும் சில சிறிய விஷயங்களை ஒரு பெரிய தயாரிப்பில் செருகலாம் மற்றும் அதில் பணம் சம்பாதிக்கலாம்.

நவீன மொழியியலின் பெரிய பணிகளில் ஒன்று சொற்பொருள் வலை, தேடல் வார்த்தைகளை பொருத்துவதன் மூலம் மட்டுமல்ல, பொருளின் மூலமாகவும் நிகழ்கிறது, மேலும் அனைத்து தளங்களும் ஒரு வழியில் அல்லது வேறு சொற்பொருளால் குறிக்கப்படுகின்றன. எடுத்துக்காட்டாக, ஒவ்வொரு நாளும் எழுதப்படும் காவல்துறை அல்லது மருத்துவ அறிக்கைகளுக்கு இது பயனுள்ளதாக இருக்கும். உள் இணைப்புகளின் பகுப்பாய்வு தேவையான பல தகவல்களை வழங்குகிறது, ஆனால் அதை கைமுறையாக படித்து கணக்கிடுவது நம்பமுடியாத நேரத்தை எடுத்துக்கொள்ளும்.

சுருக்கமாக, எங்களிடம் ஆயிரம் நூல்கள் உள்ளன, அவற்றை குழுக்களாக வரிசைப்படுத்த வேண்டும், ஒவ்வொரு உரையையும் ஒரு கட்டமைப்பின் வடிவத்தில் வழங்க வேண்டும் மற்றும் ஏற்கனவே வேலை செய்யக்கூடிய அட்டவணையைப் பெற வேண்டும். இது கட்டமைக்கப்படாத தகவல் செயலாக்கம் என்று அழைக்கப்படுகிறது. மறுபுறம், கணக்கீட்டு மொழியியல் கையாள்கிறது, எடுத்துக்காட்டாக, செயற்கை நூல்களை உருவாக்குவது. ரியல் எஸ்டேட் விலையில் ஏற்படும் மாற்றங்கள், வானிலை முன்னறிவிப்புகள், கால்பந்து போட்டிகள் பற்றிய அறிக்கைகள்: மக்கள் எழுதுவதற்கு சலிப்பாக இருக்கும் தலைப்புகளில் உரைகளை உருவாக்குவதற்கான ஒரு பொறிமுறையை ஒரு நிறுவனம் கொண்டு வந்துள்ளது. ஒரு நபருக்கு இந்த நூல்களை ஆர்டர் செய்வது மிகவும் விலை உயர்ந்தது, மேலும் இதுபோன்ற தலைப்புகளில் கணினி நூல்கள் ஒத்திசைவான மனித மொழியில் எழுதப்பட்டுள்ளன.

ரஷ்யாவில் கட்டமைக்கப்படாத தகவல்களைத் தேடும் துறையில் முன்னேற்றங்களில் யாண்டெக்ஸ் தீவிரமாக ஈடுபட்டுள்ளது. சந்தையில் உள்ள ஒருவர் கணக்கீட்டு மொழியியல் துறையில் புதிதாக ஏதாவது ஒன்றைக் கொண்டு வர முயற்சிக்கிறார்களா?

**கணக்கீட்டு மொழியியல் பற்றிய புத்தகங்கள்:**

டேனியல் ஜுராஃப்ஸ்கி, பேச்சு மற்றும் மொழி செயலாக்கம்

கிறிஸ்டோபர் மேனிங், பிரபாகர் ராகவன், ஹென்ரிச் ஷூட்ஸே, "தகவல் மீட்டெடுப்பு அறிமுகம்"

யாகோவ் டெஸ்டெலெட்ஸ், “பொது தொடரியல் அறிமுகம்”

பெரும்பாலான மொழியியல் வளர்ச்சிகள் பெரிய நிறுவனங்களின் சொத்து ஆகும்; திறந்த அணுகல். இது தொழில்துறையின் வளர்ச்சியைக் குறைக்கிறது; எங்களிடம் இலவச மொழியியல் சந்தை அல்லது தொகுக்கப்பட்ட தீர்வுகள் இல்லை.

கூடுதலாக, விரிவான தகவல் ஆதாரங்கள் பற்றாக்குறை உள்ளது. ரஷ்ய மொழியின் தேசிய கார்பஸ் போன்ற ஒரு திட்டம் உள்ளது. இது உலகின் சிறந்த தேசிய கட்டிடங்களில் ஒன்றாகும், இது வேகமாக வளர்ந்து வருகிறது மற்றும் அறிவியல் மற்றும் பயன்பாட்டு ஆராய்ச்சிக்கான நம்பமுடியாத வாய்ப்புகளைத் திறக்கிறது. டிஎன்ஏ ஆராய்ச்சிக்கு முன்னும் பின்னும் - உயிரியலில் உள்ள வேறுபாடு ஏறக்குறைய ஒன்றுதான்.

ஆனால் ரஷ்ய மொழியில் பல வளங்கள் இல்லை. எனவே, ஃப்ரேமெனெட் போன்ற அற்புதமான ஆங்கில மொழி வளத்திற்கு ஒப்புமை எதுவும் இல்லை - இது ஒரு கருத்தியல் வலையமைப்பாகும், அங்கு ஒரு குறிப்பிட்ட வார்த்தையின் மற்ற சொற்களுடன் சாத்தியமான அனைத்து இணைப்புகளும் முறையாக வழங்கப்படுகின்றன. எடுத்துக்காட்டாக, "பறக்க" என்ற சொல் உள்ளது - யார் பறக்க முடியும், எங்கே, இந்த வார்த்தை எந்த முன்மொழிவுடன் பயன்படுத்தப்படுகிறது, எந்த வார்த்தைகளுடன் இணைக்கப்பட்டுள்ளது, மற்றும் பல. இந்த ஆதாரம் மொழியை இணைக்க உதவுகிறது உண்மையான வாழ்க்கை, அதாவது, அது எவ்வாறு செயல்படுகிறது என்பதைக் கண்காணிக்க வேண்டும் குறிப்பிட்ட சொல்உருவவியல் மற்றும் தொடரியல் மட்டத்தில். இது மிகவும் பயனுள்ளதாக உள்ளது.

Avicomp நிறுவனம் தற்போது ஒத்த உள்ளடக்கத்துடன் கட்டுரைகளைத் தேடுவதற்கான செருகுநிரலை உருவாக்கி வருகிறது. அதாவது, நீங்கள் ஒரு கட்டுரையில் ஆர்வமாக இருந்தால், சதித்திட்டத்தின் வரலாற்றை விரைவாகப் பார்க்கலாம்: தலைப்பு எழுந்தபோது, ​​என்ன எழுதப்பட்டது மற்றும் இந்த சிக்கலில் ஆர்வத்தின் உச்சம் எப்போது. எடுத்துக்காட்டாக, இந்த செருகுநிரலின் உதவியுடன், சிரியாவின் நிகழ்வுகளுக்கு அர்ப்பணிக்கப்பட்ட ஒரு கட்டுரையில் இருந்து தொடங்கி, மிக விரைவாக எப்படி என்பதைப் பார்ப்பது சாத்தியமாகும். கடந்த ஆண்டுநிகழ்வுகள் அங்கு வளர்ந்தன.

முதுநிலை திட்டத்தில் கற்றல் செயல்முறை எவ்வாறு கட்டமைக்கப்படும்?

மேற்கத்திய பல்கலைக்கழகங்களைப் போலவே HSE இல் கல்வி தனித்தனி தொகுதிகளில் ஒழுங்கமைக்கப்பட்டுள்ளது. மாணவர்கள் சிறிய குழுக்களாக பிரிக்கப்படுவார்கள், சிறு தொடக்கங்கள் - அதாவது, நாம் பலவற்றைப் பெற வேண்டும் முடிக்கப்பட்ட திட்டங்கள். நாங்கள் உண்மையான தயாரிப்புகளைப் பெற விரும்புகிறோம், அதை நாங்கள் மக்களுக்குத் திறந்து பொது களத்தில் விடுவோம்.

மாணவர்களின் உடனடி திட்ட மேலாளர்களுக்கு மேலதிகமாக, அவர்களின் சாத்தியமான முதலாளிகளிடமிருந்து அவர்களைக் கண்டறிய விரும்புகிறோம் - எடுத்துக்காட்டாக, அதே Yandex இலிருந்து, இந்த விளையாட்டை விளையாடி மாணவர்களுக்கு சில ஆலோசனைகளையும் வழங்குவார்கள்.

புரோகிராமர்கள், மொழியியலாளர்கள், சமூகவியலாளர்கள், சந்தைப்படுத்துபவர்கள்: பல்வேறு துறைகளைச் சேர்ந்தவர்கள் முதுகலை திட்டத்திற்கு வருவார்கள் என்று நம்புகிறேன். மொழியியல், கணிதம் மற்றும் நிரலாக்கத்தில் பல தழுவல் படிப்புகள் இருக்கும். மொழியியலில் இரண்டு தீவிர படிப்புகள் இருக்கும், மேலும் அவை தற்போதைய மொழியியல் கோட்பாடுகளுடன் தொடர்புடையதாக இருக்கும்; கணிதமும் அப்படித்தான். "கணக்கீட்டு மொழியியலின் கணித அடித்தளங்கள்" என்று அழைக்கப்படும் ஒரு பாடத்திட்டத்தை நாங்கள் வைத்திருப்போம், இது நவீன கணக்கீட்டு மொழியியல் அடிப்படையிலான கணிதத்தின் கிளைகளை கோடிட்டுக் காட்டும்.

முதுகலை திட்டத்தில் சேர, நீங்கள் மொழியில் நுழைவுத் தேர்வில் தேர்ச்சி பெற்று போர்ட்ஃபோலியோ போட்டியில் தேர்ச்சி பெற வேண்டும்.

முக்கிய படிப்புகளுக்கு கூடுதலாக, நாங்கள் பல சுழற்சிகளைத் திட்டமிட்டுள்ளோம் - அவற்றில் இரண்டு தனிப்பட்ட தலைப்புகளின் ஆழமான ஆய்வில் கவனம் செலுத்துகின்றன, எடுத்துக்காட்டாக, இயந்திர மொழிபெயர்ப்பு மற்றும் கார்பஸ் மொழியியல், மற்றும் ஒன்று, மாறாக, தொடர்புடைய பகுதிகளுடன் தொடர்புடையது: சமூக ஊடகம், இயந்திர கற்றல் அல்லது டிஜிட்டல் மனிதநேயம் - ஆங்கிலத்தில் கற்பிக்கப்படும் என்று நாங்கள் நம்புகிறோம்.

கணக்கீட்டு மொழியியல்(மேலும்: கணிதவியல்அல்லது கணக்கீட்டு மொழியியல், ஆங்கிலம் கணக்கீட்டு மொழியியல்) - செயற்கை நுண்ணறிவு அமைப்புகளை உருவாக்கும் போது மனிதர்கள் மற்றும் விலங்குகளில் அறிவார்ந்த செயல்முறைகளின் கணித மற்றும் கணினி மாடலிங் துறையில் ஒரு அறிவியல் திசை, இது இயற்கை மொழிகளை விவரிக்க கணித மாதிரிகளைப் பயன்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது.

கணக்கீட்டு மொழியியல் இயற்கையான மொழி செயலாக்கத்துடன் மேலெழுகிறது. இருப்பினும், பிந்தையவற்றில் சுருக்க மாதிரிகளுக்கு முக்கியத்துவம் கொடுக்கப்படவில்லை, ஆனால் கணினி அமைப்புகளுக்கான மொழியை விவரிக்கும் மற்றும் செயலாக்குவதற்கான பயன்பாட்டு முறைகள்.

கணினி மொழியியலாளர்களின் செயல்பாட்டுத் துறையானது மொழியியல் தகவல்களைச் செயலாக்குவதற்கான வழிமுறைகள் மற்றும் பயன்பாட்டு நிரல்களின் வளர்ச்சி ஆகும்.

தோற்றம்

கணித மொழியியல் என்பது செயற்கை நுண்ணறிவு அறிவியலின் ஒரு பிரிவாகும். அதன் வரலாறு 1950 களில் அமெரிக்காவில் தொடங்கியது. டிரான்சிஸ்டரின் கண்டுபிடிப்பு மற்றும் புதிய தலைமுறை கணினிகள் மற்றும் முதல் நிரலாக்க மொழிகளின் வருகையுடன், இயந்திர மொழிபெயர்ப்புடன் சோதனைகள் தொடங்கியது, குறிப்பாக ரஷ்ய அறிவியல் இதழ்கள். 1960 களில், சோவியத் ஒன்றியத்தில் இதே போன்ற ஆய்வுகள் மேற்கொள்ளப்பட்டன (உதாரணமாக, 1964 ஆம் ஆண்டிற்கான "சைபர்நெட்டிக்ஸ் சிக்கல்கள்" தொகுப்பில் ரஷ்ய மொழியிலிருந்து ஆர்மீனிய மொழியில் மொழிபெயர்ப்பது பற்றிய கட்டுரை). இருப்பினும், இயந்திர மொழிபெயர்ப்பின் தரம் இன்னும் மனித மொழிபெயர்ப்பின் தரத்தை விட மிகவும் குறைவாகவே உள்ளது.

மே 15 முதல் மே 21, 1958 வரை, இயந்திர மொழிபெயர்ப்புக்கான முதல் அனைத்து யூனியன் மாநாடு I மாஸ்கோ மாநில கல்வியியல் நிறுவனத்தில் வெளிநாட்டு மொழிகள் நடைபெற்றது. ஏற்பாட்டுக் குழுவிற்கு V. Yu Rosenzweig மற்றும் நிர்வாகச் செயலர் G. V. Chernov ஆகியோர் தலைமை தாங்கினர். முழு மாநாட்டுத் திட்டம் "இயந்திர மொழிபெயர்ப்பு மற்றும் பயன்பாட்டு மொழியியல்" தொகுப்பில் வெளியிடப்பட்டுள்ளது. 1, 1959 (“மெஷின் டிரான்ஸ்லேஷன் அசோசியேஷன் புல்லட்டின் எண். 8”). V. Yu. Rosenzweig நினைவு கூர்ந்தபடி, வெளியிடப்பட்ட மாநாட்டுச் சுருக்கங்களின் தொகுப்பு அமெரிக்காவிற்கு வந்து அங்கு பெரும் தாக்கத்தை ஏற்படுத்தியது.

ஏப்ரல் 1959 இல், லெனின்கிராட் பல்கலைக்கழகம் மற்றும் பயன்பாட்டு மொழியியல் குழுவால் கூட்டப்பட்ட கணித மொழியியல் பற்றிய முதல் அனைத்து யூனியன் கூட்டம் லெனின்கிராட்டில் நடைபெற்றது. கூட்டத்தின் முக்கிய அமைப்பாளர் என்.டி.ஆண்ட்ரீவ். கூட்டத்தில் பல முக்கிய கணிதவியலாளர்கள் பங்கேற்றனர், குறிப்பாக, எஸ்.எல். சோபோலேவ், எல்.வி. கான்டோரோவிச் (பின்னர் - நோபல் பரிசு பெற்றவர்) மற்றும் ஏ. ஏ. மார்கோவ் (கடைசி இருவர் விவாதத்தில் பேசினர்). கூட்டத்தின் தொடக்க நாளில், "மொழிபெயர்ப்பு மற்றும் கணித மொழியியல் பற்றிய பொது மொழியியல் கோட்பாடு" என்ற முக்கிய உரையை வி.யு.

கணக்கீட்டு மொழியியல் பகுதிகள்

  • இயற்கை மொழி செயலாக்கம் இயற்கை மொழி செயலாக்கம்; தொடரியல், உருவவியல், சொற்பொருள் உரை பகுப்பாய்வு). இதுவும் அடங்கும்:
  1. கார்பஸ் மொழியியல், நூல்களின் மின்னணு கார்போராவின் உருவாக்கம் மற்றும் பயன்பாடு
  2. மின்னணு அகராதிகள் உருவாக்கம், தெசோரி, ஆன்டாலஜிகள். உதாரணமாக, லிங்வோ. எடுத்துக்காட்டாக, தானியங்கி மொழிபெயர்ப்பு மற்றும் எழுத்துப்பிழை சரிபார்ப்புக்கு அகராதிகள் பயன்படுத்தப்படுகின்றன.
  3. உரைகளின் தானியங்கி மொழிபெயர்ப்பு. ப்ரோம்ட் ரஷ்ய மொழிபெயர்ப்பாளர்களிடையே பிரபலமானது. இலவசங்களில் கூகுள் மொழியாக்கம் உள்ளது.
  4. உரையிலிருந்து உண்மைகளை தானாக பிரித்தெடுத்தல் (தகவல் பிரித்தெடுத்தல்) (eng. உண்மைப் பிரித்தெடுத்தல், உரைச் சுரங்கம்)
  5. தானியங்கு-குறிப்பு தானியங்கி உரை சுருக்கம்) இந்த அம்சம் மைக்ரோசாஃப்ட் வேர்டில் சேர்க்கப்பட்டுள்ளது.
  6. அறிவு மேலாண்மை அமைப்புகளை உருவாக்குதல். நிபுணர் அமைப்புகளைப் பார்க்கவும்
  7. கேள்வி மற்றும் பதில் அமைப்புகளை உருவாக்குதல் கேள்வி பதில் அமைப்புகள்).
  • ஒளியியல் எழுத்து அங்கீகாரம் OCR) உதாரணமாக, FineReader நிரல்
  • தானியங்கி பேச்சு அங்கீகாரம் ஏ.எஸ்.ஆர்) கட்டண மற்றும் இலவச மென்பொருள் உள்ளது
  • தானியங்கி பேச்சு தொகுப்பு

முக்கிய சங்கங்கள் மற்றும் மாநாடுகள்

ரஷ்யாவில் படிப்பு திட்டங்கள்

மேலும் பார்க்கவும்

"கணக்கீட்டு மொழியியல்" கட்டுரை பற்றி ஒரு மதிப்பாய்வை எழுதுங்கள்

குறிப்புகள்

இணைப்புகள்

  • (சுருக்கம்)
  • - ரஷ்ய மொழிக்கான மொழியியல் வளங்களின் அறிவுத் தளம்
  • - சில கணக்கீட்டு மொழியியல் பயன்பாடுகளின் திறந்த மூல குறியீடுகள்
  • - கணக்கீட்டு மொழியியல் திட்டங்களுக்கான ஆன்லைன் அணுகல்

கணக்கீட்டு மொழியியலை வகைப்படுத்தும் ஒரு பகுதி

"எடுங்கள், குழந்தையை எடுத்துக் கொள்ளுங்கள்," என்று பியர், அந்தப் பெண்ணை ஒப்படைத்துவிட்டு, அந்த பெண்ணிடம் அவசரமாகவும் அவசரமாகவும் பேசினார். - அவர்களுக்குக் கொடுங்கள், அவர்களுக்குக் கொடுங்கள்! - அவர் கிட்டத்தட்ட அந்தப் பெண்ணைப் பார்த்து கத்தினார், கத்திக்கொண்டிருந்த பெண்ணை தரையில் வைத்து, மீண்டும் பிரெஞ்சு மற்றும் ஆர்மீனிய குடும்பத்தை திரும்பிப் பார்த்தார். முதியவர் ஏற்கனவே வெறுங்காலுடன் அமர்ந்திருந்தார். சிறிய பிரெஞ்சுக்காரர் தனது கடைசி காலணியை கழற்றி, பூட்ஸை ஒன்றோடு ஒன்று தட்டினார். முதியவர், அழுதுகொண்டே, ஏதோ சொன்னார், ஆனால் பியர் அதை ஒரு பார்வை மட்டுமே பார்த்தார்; அவரது கவனமெல்லாம் பேட்டையில் இருந்த பிரெஞ்சுக்காரர் பக்கம் திரும்பியது, அவர் அந்த நேரத்தில், மெதுவாக அசைந்து, அந்த இளம் பெண்ணை நோக்கி நகர்ந்து, தனது பைகளில் இருந்து கைகளை எடுத்து, அவள் கழுத்தைப் பிடித்தார்.
அழகான ஆர்மேனியப் பெண், தன் நீண்ட இமைகள் தாழ்த்தப்பட்ட நிலையில், சிப்பாய் தனக்கு என்ன செய்கிறான் என்பதை அவள் பார்க்கவில்லை அல்லது உணரவில்லை என்பது போல, அதே அசைவற்ற நிலையில் தொடர்ந்து அமர்ந்தாள்.
பிரெஞ்சுக்காரர்களிடமிருந்து அவரைப் பிரித்த சில படிகளை பியர் ஓடிக்கொண்டிருந்தபோது, ​​​​ஒரு பேட்டையில் இருந்த ஒரு நீண்ட கொள்ளைக்காரன் ஏற்கனவே ஆர்மீனிய பெண்ணின் கழுத்தில் அணிந்திருந்த நகையை கிழித்துக்கொண்டிருந்தான், அந்த இளம் பெண் தன் கழுத்தை கைகளால் இறுக்கமாகப் பிடித்துக் கொண்டு கத்தினாள். .
– Laissez cette femme! [இந்தப் பெண்ணை விடுங்கள்!] - பியர் வெறித்தனமான குரலில் கூச்சலிட்டார், நீண்ட, குனிந்த சிப்பாயை தோள்களால் பிடித்து தூக்கி எறிந்தார். சிப்பாய் விழுந்து எழுந்து ஓடினான். ஆனால் அவரது தோழர், தனது காலணிகளைத் தூக்கி எறிந்துவிட்டு, ஒரு கிளீவரை எடுத்து, பயமுறுத்தும் வகையில் பியரை நோக்கி முன்னேறினார்.
- வோயோன்ஸ், பாஸ் டி பெடிஸ்! [அப்படியா நல்லது! முட்டாள்தனமாக இருக்காதே!] - அவர் கத்தினார்.
பியர் அந்த ஆத்திரத்தில் இருந்தார், அதில் அவர் எதையும் நினைவில் கொள்ளவில்லை, அதில் அவரது வலிமை பத்து மடங்கு அதிகரித்தது. அவர் வெறுங்காலுடன் இருந்த பிரெஞ்சுக்காரரை நோக்கி விரைந்தார், அவர் தனது கிளிவரை வெளியே எடுப்பதற்கு முன்பு, அவர் ஏற்கனவே அவரைத் தட்டிவிட்டு, கைமுட்டிகளால் அவரைத் தாக்கினார். சுற்றியுள்ள கூட்டத்திலிருந்து ஒரு ஒப்புதல் அழுகை கேட்டது, அதே நேரத்தில் பிரெஞ்சு லான்சர்களின் ஏற்றப்பட்ட ரோந்து மூலையைச் சுற்றி தோன்றியது. லான்சர்கள் பியர் மற்றும் பிரெஞ்சுக்காரரை நோக்கிச் சென்று அவர்களைச் சுற்றி வளைத்தனர். அடுத்து என்ன நடந்தது என்பது பியருக்கு நினைவில் இல்லை. தான் யாரையோ அடித்ததையும், அடிபட்டதையும், கடைசியில் கைகள் கட்டப்பட்டிருப்பதையும் உணர்ந்ததையும், பிரெஞ்சுப் படைவீரர்கள் கூட்டம் தன்னைச் சுற்றி நின்று ஆடையைத் தேடுவதையும் அவர் நினைவு கூர்ந்தார்.
"Il a un poignard, leutenant, [Leutenant, he has a dagger"] பியர் புரிந்துகொண்ட முதல் வார்த்தைகள்.
- ஆ, யுனே ஆர்ம்! [ஆ, ஆயுதங்கள்!] - அதிகாரி கூறினார் மற்றும் பியருடன் அழைத்துச் செல்லப்பட்ட வெறுங்காலுடன் சிப்பாயின் பக்கம் திரும்பினார்.
"C"est bon, vous direz tout cela au conseil de guerre, [சரி, சரி, நீங்கள் எல்லாவற்றையும் விசாரணையில் சொல்வீர்கள்," அதன் பிறகு அவர் பியர் பக்கம் திரும்பினார்: "Parlez vous francais vous?" நீங்கள் பிரஞ்சு பேசுகிறீர்களா?
பியர் ரத்தக் கண்களுடன் அவனைச் சுற்றிப் பார்த்தார், பதில் சொல்லவில்லை. அவரது முகம் ஒருவேளை மிகவும் பயமாகத் தோன்றியது, ஏனென்றால் அதிகாரி ஒரு கிசுகிசுப்பில் ஏதோ சொன்னார், மேலும் நான்கு லான்சர்கள் அணியிலிருந்து பிரிந்து பியரின் இருபுறமும் நின்றனர்.
– பார்லெஸ் வௌஸ் ஃப்ராங்காய்ஸ்? - அதிகாரி அவரிடம் இருந்து விலகி, அவரிடம் கேள்வியை மீண்டும் கேட்டார். - Faites venir l "interprete. [ஒரு மொழிபெயர்ப்பாளரை அழைக்கவும்.] - அவர் விட்டுச்சென்ற அணிகளுக்குப் பின்னால் இருந்து சிறிய மனிதன்சிவில் ரஷ்ய உடையில். பியர், அவரது உடை மற்றும் பேச்சு மூலம், மாஸ்கோ கடைகளில் ஒன்றிலிருந்து அவரை பிரெஞ்சுக்காரர் என்று உடனடியாக அங்கீகரித்தார்.
"Il n"a pas l"air d"un homme du peuple, [அவர் ஒரு சாமானியனைப் போல் இல்லை," என்று மொழிபெயர்ப்பாளர் பியரைப் பார்த்து கூறினார்.
- ஓ, ஓ! ca m"a bien l"air d"un des incendaires" என்று அதிகாரி மங்கலாக்கினார் "Demandez lui ce qu"il est? [ஓ, ஓ! அவர் ஒரு தீ வைப்பவர் போல் தெரிகிறது. அவர் யார் என்று கேளுங்கள்?] என்று அவர் மேலும் கூறினார்.
- யார் நீ? - மொழிபெயர்ப்பாளர் கேட்டார். அதிகாரிகள் பதில் சொல்ல வேண்டும்,'' என்றார்.
– Je ne vous dirai pas qui je suis. ஜெ சூயிஸ் வோட்ரே கைதி. Emmenez moi, [நான் யார் என்று நான் உங்களுக்குச் சொல்ல மாட்டேன். நான் உங்கள் கைதி. என்னை அழைத்துச் செல்லுங்கள், ”பியர் திடீரென்று பிரெஞ்சு மொழியில் கூறினார்.
- ஹ ஹ! - அதிகாரி முகம் சுளிக்கிறார். - மார்ச்சுகள்!
லான்சர்களைச் சுற்றி ஒரு கூட்டம் கூடியது. பியருக்கு மிக அருகில் ஒரு பெண் ஒரு பெண்மணியுடன் நின்று கொண்டிருந்தாள்; மாற்றுப்பாதை நகர ஆரம்பித்ததும், அவள் முன்னேறினாள்.
- அவர்கள் உன்னை எங்கே அழைத்துச் செல்கிறார்கள், என் அன்பே? - அவள் சொன்னாள். - இந்த பெண், இந்த பெண்ணை நான் என்ன செய்வேன், அவள் அவர்களுடையது இல்லையென்றால்! - பெண் கூறினார்.
– Qu"est ce qu"elle veut cette femme? [அவளுக்கு என்ன வேண்டும்?] - அதிகாரி கேட்டார்.
பியர் குடிபோதையில் இருந்ததைப் போல தோற்றமளித்தார். அவன் காப்பாற்றிய பெண்ணைப் பார்த்ததும் அவனது பரவச நிலை இன்னும் உக்கிரமடைந்தது.
"Ce qu"elle dit?" என்றார். "Elle m"apporte ma fille que je viens de sauver des flammes," என்று அவர் கூறினார். - விடைபெறு! [அவளுக்கு என்ன வேண்டும்? நான் நெருப்பிலிருந்து காப்பாற்றிய என் மகளை அவள் சுமந்து செல்கிறாள். பிரியாவிடை!] - இந்த இலக்கற்ற பொய் எவ்வாறு தப்பித்தது என்று தெரியாமல், பிரெஞ்சுக்காரர்களிடையே ஒரு தீர்க்கமான, புனிதமான படியுடன் நடந்தார்.
மாஸ்கோவின் பல்வேறு தெருக்களுக்கு கொள்ளையடிப்பதை அடக்குவதற்கும், குறிப்பாக தீக்குளித்தவர்களைக் கைப்பற்றுவதற்கும் துரோனெலின் உத்தரவின் பேரில் அனுப்பப்பட்டவர்களில் பிரெஞ்சு ரோந்தும் ஒன்றாகும், அன்றைய பொதுக் கருத்தின்படி, உயர் பதவிகளில் இருந்த பிரெஞ்சுக்காரர்களிடையே அவர்கள் தோன்றினர். தீக்கு காரணம். பல தெருக்களைச் சுற்றிப் பயணித்த ரோந்து மேலும் ஐந்து சந்தேகத்திற்கிடமான ரஷ்யர்கள், ஒரு கடைக்காரர், இரண்டு கருத்தரங்குகள், ஒரு விவசாயி மற்றும் ஒரு வேலைக்காரன் மற்றும் பல கொள்ளையர்களை எடுத்தது. ஆனால் சந்தேகத்திற்குரிய நபர்களில், பியர் மிகவும் சந்தேகத்திற்குரியவராகத் தோன்றினார். அவர்கள் அனைவரும் இரவைக் கழிக்க அழைத்து வரப்பட்டபோது பெரிய வீடு Zubovsky Val இல், ஒரு காவலர் இல்லம் நிறுவப்பட்டது, பியர் தனித்தனியாக கடுமையான காவலில் வைக்கப்பட்டார்.

இந்த நேரத்தில் செயின்ட் பீட்டர்ஸ்பர்க்கில், மிக உயர்ந்த வட்டாரங்களில், முன்னெப்போதையும் விட அதிக ஆவேசத்துடன், ருமியன்சேவ், பிரெஞ்சு, மரியா ஃபியோடோரோவ்னா, சரேவிச் மற்றும் பிறரின் கட்சிகளுக்கு இடையே ஒரு சிக்கலான போராட்டம் இருந்தது, எப்போதும் போல, எக்காள சத்தத்தால் மூழ்கியது. நீதிமன்ற ட்ரோன்களின். ஆனால் அமைதியான, ஆடம்பரமான, பேய்கள், வாழ்க்கையின் பிரதிபலிப்புகளில் மட்டுமே அக்கறை கொண்ட செயின்ட் பீட்டர்ஸ்பர்க் வாழ்க்கை முன்பு போலவே சென்றது; இந்த வாழ்க்கையின் போக்கின் காரணமாக, ரஷ்ய மக்கள் தங்களைக் கண்டடைந்த ஆபத்து மற்றும் கடினமான சூழ்நிலையை அடையாளம் காண பெரும் முயற்சிகளை மேற்கொள்வது அவசியம். அதே வெளியேற்றங்கள், பந்துகள், அதே பிரெஞ்சு தியேட்டர், நீதிமன்றங்களின் அதே நலன்கள், சேவை மற்றும் சூழ்ச்சியின் அதே நலன்கள் இருந்தன. உயர்மட்ட வட்டாரங்களில் மட்டுமே தற்போதைய சூழ்நிலையின் சிரமத்தை நினைவுபடுத்தும் முயற்சிகள் மேற்கொள்ளப்பட்டன. இத்தகைய கடினமான சூழ்நிலைகளில் இரண்டு பேரரசிகளும் ஒருவருக்கொருவர் எதிர்மாறாக எப்படி நடந்துகொண்டார்கள் என்பது கிசுகிசுக்களில் கூறப்பட்டது. பேரரசி மரியா ஃபியோடோரோவ்னா, தனது அதிகார வரம்பிற்குட்பட்ட தொண்டு மற்றும் கல்வி நிறுவனங்களின் நலனில் அக்கறை கொண்டு, அனைத்து நிறுவனங்களையும் கசானுக்கு அனுப்ப உத்தரவிட்டார், மேலும் இந்த நிறுவனங்களின் பொருட்கள் ஏற்கனவே நிரம்பியிருந்தன. பேரரசி எலிசவெட்டா அலெக்ஸீவ்னா, என்ன உத்தரவுகளை செய்ய விரும்புகிறாள் என்று கேட்டபோது, ​​அவளது சிறப்பியல்பு ரஷ்ய தேசபக்தியுடன், இது இறையாண்மையைப் பற்றியது என்பதால், அரசு நிறுவனங்களைப் பற்றி உத்தரவிட முடியாது என்று பதிலளித்தார்; தனிப்பட்ட முறையில் அவளைச் சார்ந்திருக்கும் அதே விஷயத்தைப் பற்றி, அவர் செயின்ட் பீட்டர்ஸ்பர்க்கை விட்டு வெளியேறும் கடைசி நபராக இருப்பார் என்று கூறினாள்.