PV-RNN ( Pose-Variation Recurrent Neural Network )
ඉරියව්-විචල්යතා පුනරාවර්තන ස්නායු ජාලය
PV-RNN ( Pose-Variation Recurrent Neural Network ඉරියව්-විචල්යතා පුනරාවර්තන ස්නායු ජාලය) යනු ගතික වස්තු ලුහුබැඳීම හෝ රූප අනුපිළිවෙලක චලනය පුරෝකථනය කිරීම වැනි ඉරියව් ඇස්තමේන්තුව සහ විචල්යතා ආකෘති නිර්මාණය යන දෙකම ඇතුළත් කාර්යයන් හැසිරවීම සඳහා නිර්මාණය කර ඇති ස්නායුක ජාල ගෘහ නිර්මාණ ශිල්පයකි.
ප්රධාන සංකල්පවල දළ සටහනක්...
1. ඉරියව් ඇස්තමේන්තුව:
- මෙය අවකාශයේ වස්තුවක (හෝ මිනිස් සිරුරේ) පිහිටීම සහ දිශානතිය තීරණය කිරීමට යොමු කරයි.
- PV-RNN මෙම අදහස භාවිතා කරන්නේ වස්තූන් කාලයත් සමඟ චලනය වන ආකාරය සහ එක් එක් කාල පියවරේදී ඒවායේ ඉරියව්ව ඇස්තමේන්තු කිරීමෙනි.
2. විචල්යතා ආකෘති නිර්මාණය:
- මෙයට විවිධ කාල පියවර හරහා වස්තුවේ පෙනුමේ හෝ වින්යාසයේ වෙනස්කම් තේරුම් ගැනීම ඇතුළත් වේ.
- උදාහරණයක් ලෙස වීඩියෝවක, චලනය, ආලෝකකරණ වෙනස්කම් හෝ විරූපණය හේතුවෙන් වස්තුවක ප්රමාණය, හැඩය හෝ වර්ණය වෙනස් විය හැකිය. PV-RNN එවැනි වෙනස්කම් ඵලදායී ලෙස හැසිරවීමට නිර්මාණය කර ඇත.
3. පුනරාවර්තන ස්නායු ජාල (RNNs):
- PV-RNN හි "RNN" කොටසෙන් අදහස් කරන්නේ පුනරාවර්තන ස්නායු ජාල භාවිතා කිරීමයි, ඒවා වීඩියෝ රාමු හෝ කාල ශ්රේණි දත්ත වැනි අනුක්රමික දත්ත සඳහා විශිෂ්ටයි. රාමු හෝ පියවර අතර තාවකාලික යැපීම් ග්රහණය කර ගත හැකි අභ්යන්තර තත්වයක් RNNs පවත්වා ගනී.
PV-RNN ක්රියා කරන ආකාරය:
- PV-RNN විශේෂාංග නිස්සාරණය සඳහා සහ තාවකාලික වෙනස්කම් නිරීක්ෂණය කිරීම සඳහා පුනරාවර්තන ඒකක සඳහා සංකෝචන ස්ථර සංයෝජනයක් භාවිතා කරයි.
- එය ක්රියා කරන්නේ වීඩියෝවක හෝ අනුපිළිවෙලක වස්තුවක (උදා: මිනිසෙකු හෝ චලනය වන අයිතමයක්) ඉරියව්ව පුරෝකථනය කිරීමෙන් සහ රාමු හෝ කාල පියවර අතර වෙනස්කම් (විචලනයන්) සඳහා ගැලපීමෙන් ය.
- චලන පුරෝකථනය, වීඩියෝවක ඉරියව් ලුහුබැඳීම සහ සජීවිකරණ හෝ රොබෝ විද්යාවේ පවා මෙම අනාවැකි උපකාරී වේ.
*යෙදුම්:
- මානව චලන ලුහුබැඳීම: පරිගණක දර්ශනයේදී, PV-RNN මිනිසුන්ගේ චලනය නිරීක්ෂණය කිරීම සහ පුරෝකථනය කිරීම සඳහා භාවිතා කළ හැකිය.
- වීඩියෝවල වස්තු ලුහුබැඳීම: රාමු හරහා වස්තූන්ගේ අනාගත ස්ථාන සහ ඉරියව් හඳුනා ගැනීම සහ පුරෝකථනය කිරීම.
- රොබෝ විද්යාව සහ අනුකරණය: වස්තූන් හෝ රොබෝවරු චලනය වන ආකාරය සහ ඒවායේ පරිසරය සමඟ අන්තර් ක්රියා කරන ආකාරය තේරුම් ගැනීම.
ප්රධාන ශක්තිය:
*තාවකාලික සම්බන්ධතා (කාලයත් සමඟ යමක් චලනය වන ආකාරය) සහ *අවකාශීය සම්බන්ධතා (වස්තුවල පිහිටීම සහ දිශානතිය) යන දෙකම ග්රහණය කර ගැනීමේදී PV-RNN විශිෂ්ටයි.
* PV-RNN සදහා නිදසුනක් ...
PV-RNN** හි නිශ්චිත අංගයක් පිළිබද විමසමු ගතික අනුපිළිවෙලවල් තුළ ඉරියව් ඇස්තමේන්තුව සහ විචල්යතා ආකෘති නිර්මාණය හැසිරවීමේ හැකියාව, විශේෂයෙන් රාමු හරහා වස්තුවක් හෝ මිනිස් චලිතයක් නිරීක්ෂණය කරන සහ පුරෝකථනය කරන ආකාරය.
ඉරියව් ඇස්තමේන්තුව සහ ලුහුබැඳීම
PV-RNN සන්දර්භය තුළ, ඉරියව් ඇස්තමේන්තුව යනු ඕනෑම අවස්ථාවක වස්තුවක (උදා: මිනිසෙකු හෝ රොබෝවක්) අවකාශීය වින්යාසය තීරණය කිරීමයි. උදාහරණයක් ලෙස, අපි පුද්ගලයෙකු නිරීක්ෂණය කරන්නේ නම්, ඉරියව්ව මගින් පුද්ගලයාගේ ශරීරය ත්රිමාණ අවකාශයේ ස්ථානගත කර ඇති ආකාරය නිරූපණය කෙරේ.
*අභියෝග:
1. තාවකාලික ගතිකය:
- වස්තූන් හෝ චලනය වන පුද්ගලයින් කාලයත් සමඟ ස්ථානය වෙනස් කරන අතර, ඒවායේ පෙනුම ද වෙනස් විය හැකිය (ආලෝකකරණය, කැමරා කෝණය, අවහිරතා ආදිය හේතුවෙන්).
- PV-RNN මෙය හසුරුවන්නේ තාවකාලික පරායත්තතා ග්රහණය කර ගත හැකි පුනරාවර්තන ස්ථර භාවිතා කිරීමෙනි - එනම්, රාමු අතර වස්තුවේ පිහිටීම සහ දිශානතිය වෙනස් වන ආකාරයයි.
2. අවහිරය:
- වස්තුවක කොටස් සැඟවුණු විට (උදා: පුද්ගලයෙකු තම පිටුපසට හරවා ගැනීම හෝ වෙනත් වස්තුවක් පිටුපස ඇවිදීම), සාම්ප්රදායික ක්රම මගින් ඉරියව්ව නිවැරදිව නිරීක්ෂණය කිරීම දුෂ්කර වේ.
- PV-RNN හට තවමත් පෙර රාමු වලින් තොරතුරු ලබා ගැනීමෙන් (පුනරාවර්තන ව්යුහයට ස්තූතිවන්ත වන අතර) ඉරියව්ව පුරෝකථනය කළ හැකි අතර එය අවහිරතා වලට වඩාත් ඔරොත්තු දෙයි.
3. සංකීර්ණ චලිතය:
- චලනය සංකීර්ණ විය හැකිය, විවිධ වේගයන්, දිශාවේ වෙනස්කම් හෝ අනපේක්ෂිත හැසිරීම් (පුද්ගලයෙකු හදිසියේ පැනීම වැනි) සමඟ.
- කාලයත් සමඟ අභ්යන්තර මතකයක් පවත්වා ගැනීමට RNN සතු හැකියාව, චලනයන්හි අනුපිළිවෙල වඩා හොඳින් තේරුම් ගැනීමට, අනාගත ඉරියව් ඉහළ නිරවද්යතාවයකින් පුරෝකථනය කිරීමට උපකාරී වේ.
*PV-RNN මෙම අභියෝග සමඟ කටයුතු කරන ආකාරය:
*පුනරාවර්තන සම්බන්ධතා: PV-RNN හි RNN කොටස මඟින් ජාලය තනි රාමුවක් දෙස පමණක් නොබලන බව සහතික කරයි, නමුත් එම ස්ථානය දක්වා සම්පූර්ණ අනුපිළිවෙල සලකා බලයි. මෙය චලන පුරෝකථනය සහ ඉරියව් නිවැරදි කිරීම සඳහා අපැහැදිලි හෝ අවහිරතා වලට මුහුණ දෙන විට වැදගත් වේ.
*විශේෂාංග නිස්සාරණය: සංකෝචන ස්ථර භාවිතා කරමින්, PV-RNN එක් එක් රාමුවෙන් වැදගත් ලක්ෂණ උපුටා ගනී. මෙම ලක්ෂණ RNN විසින් සකසනු ලබන්නේ වස්තුව ඊළඟ රාමුවේ දිස්වන ආකාරය පුරෝකථනය කිරීම සඳහා වන අතර, ඉරියව් සහ පෙනුමේ වෙනස්කම් යන දෙකම සැලකිල්ලට ගනී.
*චලන පුරෝකථනය: PV-RNN චලන පුරෝකථනය කිරීමට හැකියාව ඇත, එනම් වත්මන් චලන රටාව මත පදනම්ව අනාගතයේදී වස්තුව කොතැනදැයි ඇස්තමේන්තු කළ හැකිය. අනාගත ස්ථාන තේරුම් ගැනීම ඉතා වැදගත් වන රොබෝ විද්යාව සහ ස්වයංක්රීය වාහන වැනි යෙදුම්වල මෙය අතිශයින් ප්රයෝජනවත් වේ.
*උදාහරණ අවස්ථාව:
*ක්රීඩා වීඩියෝවක, PV-RNN හට ක්රීඩකයෙකුගේ චලනය නිරීක්ෂණය කිරීමට, ත්රිමාණ අවකාශයේ ඔවුන්ගේ ශරීර පිහිටීම (ඉරියව්ව) තක්සේරු කිරීමට සහ ක්රීඩකයාගේ ශරීරයේ කොටස් කෙටියෙන් අපැහැදිලි වුවද (උදා: ඒවා ජනාකීර්ණ ප්රදේශයක හෝ කැමරා කෝණය වෙනස් වුවද) ඔවුන්ගේ ඊළඟ චලනය පුරෝකථනය කිරීමට හැකිය. චලන බොඳවීම හෝ අර්ධ අවහිර වීම වැනි අභියෝග නොතකා, කාලයත් සමඟ ක්රීඩකයාගේ ක්රියාවන් වඩාත් නිවැරදිව නිරීක්ෂණය කිරීමට මෙය ආකෘතියට ඉඩ සලසයි.
පසු සටහන - මා මෙම කෘතිම බුද්ධිය සහ එහි ව්යුහකරණය පිළිබදව වඩාත් අධ්යයනය කරමින් මෙම ලිපි සටහන් කරනුයේ පාඨක ඔබගේ ප්රඥාගෝචරත්වය සහ ඔබ දැනුමින් සන්නද්ධ විය යුතු නිසාවෙනි. මා කටයුතු කරන පිරිවෙන් කේෂ්ත්රය තුළ සිටින වහල් එහෙයියන් විසින් මා සතු දැනුම හෑල්ලුවට ලක් කොට සමහර කේෂ්ත්රයට කළ හැකිව තිබු විශාල තාක්ෂණික සේවය මා වෙතින් ඉවත් කළ එම කුහකත්වය පිළිබදවත් සටහන් තබමි. එහෙත් මාගේ මෙම කටයුතු එවන් වහල් හිපාටුවන් හට නොනැවැත්විය හැකි බවද ඇවැසි නම් කුහක හිපාටුත්වයට තාක්ෂණිකව පිළිතුරු දීමට සුදානම් බවද සටහන් තබමි.
🤖 ප්රසන්න විජයසිංහ ....
![]() |
CGI Graphic By Prasanna. |
Comments
Post a Comment