|
The Philosophy of SFT dataset is that it is a json dictionary structure containing the following
|
|
{'prompt' , 'prompt_id' , 'message' , 'dialect'}
|
|
|
|
This examples can be single turn or multi turn
|
|
|
|
Example(Hindi)
|
|
{ 'dialect': 'hi'
|
|
'prompt': 'मुझे लंदन में कौन से प्रसिद्ध स्थलों का दौरा करना चाहिए?'
|
|
'message': 'आपको बिग बेन, टावर ऑफ लंदन, लंदन आई, ग्रीनविच म्यूजियम जैसी जगहों पर जाना चाहिए।'
|
|
}
|
|
|
|
An example in another Hindi dialect would be as follows
|
|
Example(Hindi - Dogri)
|
|
{ 'dialect': 'do'
|
|
'prompt': 'लंदन च किस मशहूर लैंडमार्क दा दौरा लाना चाहिदा ?'
|
|
'message': 'तुसें गी बिग बेन, टावर ऑफ लंदन, लंदन आई, ग्रीनविच म्यूजियम जनेह् थाह्रें दा दौरा लाना चाहिदा।'
|
|
}
|
|
|