ਲੇਖ

GPT4 ਬਨਾਮ ChatGPT: ਅਸੀਂ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ, ਪ੍ਰਦਰਸ਼ਨ, ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦੇ ਹਾਂ

ਨਵੇਂ ਜਨਰੇਟਿਵ ਭਾਸ਼ਾ ਮਾਡਲ ਤੋਂ ਮੀਡੀਆ, ਸਿੱਖਿਆ, ਕਾਨੂੰਨ ਅਤੇ ਤਕਨਾਲੋਜੀ ਸਮੇਤ ਸਮੁੱਚੇ ਉਦਯੋਗਾਂ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬਦਲਣ ਦੀ ਉਮੀਦ ਹੈ। 

ਹਾਲ ਹੀ ਦੇ ਮਹੀਨਿਆਂ ਵਿੱਚ, ਜਿਸ ਗਤੀ ਨਾਲ ਨਵੀਨਤਾਕਾਰੀ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੂੰ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ ਉਹ ਹੈਰਾਨੀਜਨਕ ਹੈ। ਇਸ ਲੇਖ ਵਿੱਚ, ਅਸੀਂ GPT4 ਬਨਾਮ ChatGPT ਵਿਚਕਾਰ ਮੁੱਖ ਸਮਾਨਤਾਵਾਂ ਅਤੇ ਅੰਤਰਾਂ ਨੂੰ ਕਵਰ ਕਰਾਂਗੇ, ਜਿਸ ਵਿੱਚ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ, ਪ੍ਰਦਰਸ਼ਨ, ਸਮਰੱਥਾਵਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਸ਼ਾਮਲ ਹਨ।

GPT4 ਬਨਾਮ ਚੈਟਜੀਪੀਟੀ: ਸਿਖਲਾਈ ਦੇ ਢੰਗਾਂ ਵਿੱਚ ਸਮਾਨਤਾਵਾਂ ਅਤੇ ਅੰਤਰ

GPT4 ਅਤੇ ChatGPT GPT ਮਾਡਲਾਂ ਦੇ ਪੁਰਾਣੇ ਸੰਸਕਰਣਾਂ 'ਤੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਦੇ ਸੁਧਾਰਾਂ, ਵਧੇਰੇ ਵਧੀਆ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ ਨੂੰ ਲਾਗੂ ਕਰਨ, ਅਤੇ ਸਿਖਲਾਈ ਦੇ ਮਾਪਦੰਡਾਂ ਦੀ ਉੱਚ ਸੰਖਿਆ ਦੇ ਨਾਲ ਬਣਾਉਂਦੇ ਹਨ।

ਦੋਵੇਂ ਡਿਜ਼ਾਈਨ ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ 'ਤੇ ਅਧਾਰਤ ਹਨ, ਜੋ ਇਨਪੁਟ ਕ੍ਰਮਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਲਈ ਇੱਕ ਏਨਕੋਡਰ ਅਤੇ ਆਉਟਪੁੱਟ ਕ੍ਰਮ ਬਣਾਉਣ ਲਈ ਇੱਕ ਡੀਕੋਡਰ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਏਨਕੋਡਰ ਅਤੇ ਡੀਕੋਡਰ ਇੱਕ ਵਿਧੀ ਦੁਆਰਾ ਜੁੜੇ ਹੋਏ ਹਨ, ਜੋ ਡੀਕੋਡਰ ਨੂੰ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਇਨਪੁਟ ਕ੍ਰਮਾਂ ਵੱਲ ਧਿਆਨ ਦੇਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।

GPT4 ਤਕਨੀਕੀ ਰਿਪੋਰਟ ਓਪਨਏਆਈ ਦਾ ਹਵਾਲਾ ਦਿੰਦੇ ਹੋਏ, ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਅਤੇ GPT4 ਬਣਾਉਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਬਹੁਤ ਘੱਟ ਸਮਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।competitive landscape and the safety implications of large-scale models". ਅਸੀਂ ਕੀ ਜਾਣਦੇ ਹਾਂ ਕਿ GPT4 ਅਤੇ ChatGPT ਨੂੰ ਸ਼ਾਇਦ ਇਸੇ ਤਰ੍ਹਾਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਜੋ ਕਿ GPT-2 ਅਤੇ GPT-3 ਲਈ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ ਤੋਂ ਕਾਫ਼ੀ ਅੰਤਰ ਹੈ। ਅਸੀਂ GPT4 ਨਾਲੋਂ ChatGPT ਲਈ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ ਬਾਰੇ ਬਹੁਤ ਕੁਝ ਜਾਣਦੇ ਹਾਂ, ਇਸ ਲਈ ਅਸੀਂ ਉੱਥੇ ਸ਼ੁਰੂ ਕਰਾਂਗੇ।

ਚੈਟਜੀਪੀਟੀ

ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਡੈਮੋ ਡੇਟਾ ਸਮੇਤ ਡਾਇਲਾਗ ਡੇਟਾਸੈਟਾਂ ਨਾਲ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਐਨੋਟੇਟਰ ਖਾਸ ਬੇਨਤੀਆਂ ਦੇ ਜਵਾਬ ਵਿੱਚ ਇੱਕ ਚੈਟਬੋਟ ਸਹਾਇਕ ਦੇ ਸੰਭਾਵਿਤ ਆਉਟਪੁੱਟ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ। ਇਸ ਡੇਟਾ ਦੀ ਵਰਤੋਂ GPT3.5 ਨੂੰ ਨਿਰੀਖਣ ਕੀਤੀ ਸਿਖਲਾਈ ਦੇ ਨਾਲ ਟਿਊਨ ਕਰਨ ਲਈ, ਇੱਕ ਨੀਤੀ ਮਾਡਲ ਤਿਆਰ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਿਸਦੀ ਵਰਤੋਂ ਬੇਨਤੀਆਂ ਪ੍ਰਦਾਨ ਕੀਤੇ ਜਾਣ 'ਤੇ ਕਈ ਜਵਾਬ ਪੈਦਾ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਮਨੁੱਖੀ ਐਨੋਟੇਟਰ ਫਿਰ ਵਰਗੀਕ੍ਰਿਤ ਕਰਦੇ ਹਨ ਕਿ ਦਿੱਤੇ ਗਏ ਪ੍ਰੋਂਪਟ ਲਈ ਕਿਹੜੇ ਜਵਾਬਾਂ ਨੇ ਸਭ ਤੋਂ ਵਧੀਆ ਨਤੀਜੇ ਦਿੱਤੇ, ਜੋ ਇਨਾਮ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਰਿਵਾਰਡ ਮਾਡਲ ਨੂੰ ਫਿਰ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਨੀਤੀ ਮਾਡਲ ਨੂੰ ਦੁਹਰਾਉਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।

ChatGPT ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਮਨੁੱਖੀ ਫੀਡਬੈਕ ਤੋਂ ਮਜ਼ਬੂਤੀ ਦੀ ਸਿਖਲਾਈ (RLHF), ਸਿਖਲਾਈ ਦੌਰਾਨ ਭਾਸ਼ਾ ਦੇ ਮਾਡਲ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਲਈ ਮਨੁੱਖੀ ਫੀਡਬੈਕ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਦਾ ਇੱਕ ਤਰੀਕਾ। ਇਹ ਮਾਡਲ ਆਉਟਪੁੱਟ ਨੂੰ ਉਪਭੋਗਤਾ ਦੁਆਰਾ ਬੇਨਤੀ ਕੀਤੀ ਗਤੀਵਿਧੀ ਦੇ ਨਾਲ ਇਕਸਾਰ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ, ਨਾ ਕਿ ਆਮ ਸਿਖਲਾਈ ਡੇਟਾ, ਜਿਵੇਂ ਕਿ GPT-3 ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਦੀ ਬਜਾਏ।

GPT4

ਓਪਨਏਆਈ ਨੇ ਅਜੇ ਇਸ ਬਾਰੇ ਵੇਰਵੇ ਨਹੀਂ ਦਿੱਤੇ ਹਨ ਕਿ ਇਸ ਨੇ GPT4 ਨੂੰ ਕਿਵੇਂ ਸਿਖਲਾਈ ਦਿੱਤੀ। ਉਨ੍ਹਾਂ ਦੀ ਤਕਨੀਕੀ ਰਿਪੋਰਟ ਵਿੱਚ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar". ਅਸੀਂ ਕੀ ਜਾਣਦੇ ਹਾਂ ਕਿ GPT4 ਇੱਕ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਟ੍ਰਾਂਸਫਾਰਮਰ-ਸਟਾਈਲ ਜਨਰੇਟਿਵ ਮਲਟੀਮੋਡ ਮਾਡਲ ਹੈ। ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਡੇਟਾ ਅਤੇ ਲਸੰਸਸ਼ੁਦਾ ਤੀਜੀ-ਧਿਰ ਦੇ ਡੇਟਾ ਅਤੇ ਬਾਅਦ ਵਿੱਚ RLHF ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਧੀਆ-ਟਿਊਨ ਕੀਤੇ ਜਾਣ 'ਤੇ ਦੋਵੇਂਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ, ਓਪਨਏਆਈ ਨੇ ਮਾਡਲ ਜਵਾਬਾਂ ਨੂੰ ਵਧੇਰੇ ਸਟੀਕ ਬਣਾਉਣ ਅਤੇ ਸੁਰੱਖਿਆ ਗਾਰਡਰੇਲਾਂ ਤੋਂ ਬਾਹਰ ਜਾਣ ਦੀ ਘੱਟ ਸੰਭਾਵਨਾ ਬਣਾਉਣ ਲਈ ਆਪਣੀਆਂ ਅੱਪਡੇਟ ਕੀਤੀਆਂ RLHF ਤਕਨੀਕਾਂ ਬਾਰੇ ਵੇਰਵੇ ਸਾਂਝੇ ਕੀਤੇ।

ਇੱਕ ਨੀਤੀ ਮਾਡਲ (ਜਿਵੇਂ ਕਿ ਚੈਟਜੀਪੀਟੀ ਦੇ ਨਾਲ) ਦੀ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, RLHF ਦੀ ਵਰਤੋਂ ਵਿਰੋਧੀ ਸਿਖਲਾਈ ਵਿੱਚ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਜੋ ਇੱਕ ਮਾਡਲ ਨੂੰ ਭੈੜੀਆਂ ਉਦਾਹਰਣਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੰਦੀ ਹੈ ਜਿਸਦਾ ਉਦੇਸ਼ ਭਵਿੱਖ ਵਿੱਚ ਅਜਿਹੀਆਂ ਉਦਾਹਰਣਾਂ ਤੋਂ ਬਚਾਅ ਕਰਨ ਲਈ ਮਾਡਲ ਨੂੰ ਧੋਖਾ ਦੇਣਾ ਹੈ। GPT4 ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਮਾਹਰ ਵਿਰੋਧੀ ਮੰਗਾਂ ਪ੍ਰਤੀ ਰਾਜਨੀਤਿਕ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ। ਇਹਨਾਂ ਜਵਾਬਾਂ ਦੀ ਵਰਤੋਂ ਫਿਰ ਵਾਧੂ ਇਨਾਮ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਜੋ ਨੀਤੀ ਮਾਡਲ ਨੂੰ ਦੁਹਰਾਉਂਦੇ ਹੋਏ ਸੁਧਾਰਦੇ ਹਨ, ਜਿਸਦੇ ਨਤੀਜੇ ਵਜੋਂ ਇੱਕ ਅਜਿਹਾ ਮਾਡਲ ਹੁੰਦਾ ਹੈ ਜੋ ਖ਼ਤਰਨਾਕ, ਬਚਣ ਵਾਲੇ, ਜਾਂ ਗਲਤ ਜਵਾਬ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਘੱਟ ਹੁੰਦਾ ਹੈ।

GPT4 ਬਨਾਮ ChatGPT ਸਮਾਨਤਾਵਾਂ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਅਤੇ ਸਮਰੱਥਾਵਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਅੰਤਰ

ਸਮਰੱਥਾ

ਕਾਰਜਕੁਸ਼ਲਤਾ ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ChatGPT ਅਤੇ GPT4 ਵੱਖ-ਵੱਖ ਨਾਲੋਂ ਵਧੇਰੇ ਸਮਾਨ ਹਨ। ਆਪਣੇ ਪੂਰਵਵਰਤੀ ਵਾਂਗ, GPT-4 ਵੀ ਇੱਕ ਗੱਲਬਾਤ ਸ਼ੈਲੀ ਵਿੱਚ ਇੰਟਰੈਕਟ ਕਰਦਾ ਹੈ ਜਿਸਦਾ ਉਦੇਸ਼ ਉਪਭੋਗਤਾ ਨਾਲ ਇਕਸਾਰ ਹੋਣਾ ਹੈ। ਜਿਵੇਂ ਕਿ ਤੁਸੀਂ ਹੇਠਾਂ ਦੇਖ ਸਕਦੇ ਹੋ, ਇੱਕ ਵਿਆਪਕ ਸਵਾਲ ਲਈ ਦੋ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਜਵਾਬ ਬਹੁਤ ਸਮਾਨ ਹਨ।

ਓਪਨਏਆਈ ਸਹਿਮਤ ਹੈ ਕਿ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਅੰਤਰ ਸੂਖਮ ਹੋ ਸਕਦਾ ਹੈ ਅਤੇ ਕਹਿੰਦਾ ਹੈ ਕਿ "ਫਰਕ ਉਦੋਂ ਸਾਹਮਣੇ ਆਉਂਦਾ ਹੈ ਜਦੋਂ ਕੰਮ ਦੀ ਗੁੰਝਲਤਾ ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਪਹੁੰਚ ਜਾਂਦੀ ਹੈ"। ਛੇ ਮਹੀਨਿਆਂ ਦੀ ਵਿਰੋਧੀ ਸਿਖਲਾਈ ਦੇ ਮੱਦੇਨਜ਼ਰ ਜੋ GPT4 ਬੇਸ ਮਾਡਲ ਨੇ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ ਦੇ ਪੜਾਅ ਵਿੱਚ ਗੁਜ਼ਰਿਆ, ਇਹ ਸੰਭਵ ਤੌਰ 'ਤੇ ਇੱਕ ਸਹੀ ਵਿਸ਼ੇਸ਼ਤਾ ਹੈ।

ਚੈਟਜੀਪੀਟੀ ਦੇ ਉਲਟ, ਜੋ ਸਿਰਫ਼ ਟੈਕਸਟ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ, GPT4 ਚਿੱਤਰ ਅਤੇ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ ਦੋਵਾਂ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ, ਟੈਕਸਟ ਜਵਾਬ ਵਾਪਸ ਕਰਦਾ ਹੈ। ਇਸ ਲਿਖਤ ਦੇ ਰੂਪ ਵਿੱਚ, ਬਦਕਿਸਮਤੀ ਨਾਲ, ਚਿੱਤਰ ਇਨਪੁਟਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਯੋਗਤਾ ਅਜੇ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਨਹੀਂ ਹੈ।

ਪ੍ਰੇਸਟੈਜ਼ਿਓਨ

ਜਿਵੇਂ ਉੱਪਰ ਦੱਸਿਆ ਗਿਆ ਹੈ, ਓਪਨਏਆਈ ਜੀਪੀਟੀ-4 (ਜਿਸ ਤੋਂ ਚੈਟਜੀਪੀਟੀ ਟਿਊਨ ਕੀਤਾ ਗਿਆ ਸੀ) ਦੇ ਮੁਕਾਬਲੇ, GPT3.5 ਲਈ ਸੁਰੱਖਿਆ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਦੀ ਰਿਪੋਰਟ ਕਰਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਇਹ ਫਿਲਹਾਲ ਅਸਪਸ਼ਟ ਹੈ ਕਿ ਕੀ:

  • ਵਰਜਿਤ ਸਮੱਗਰੀ ਲਈ ਬੇਨਤੀਆਂ ਦੇ ਜਵਾਬਾਂ ਦੀ ਕਮੀ,
  • ਜ਼ਹਿਰੀਲੇ ਤੱਤਾਂ ਦੀ ਉਤਪੱਤੀ ਵਿੱਚ ਕਮੀ e
  • ਸੰਵੇਦਨਸ਼ੀਲ ਵਿਸ਼ਿਆਂ ਦੇ ਜਵਾਬਾਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨਾ

GPT4 ਮਾਡਲ ਜਾਂ ਵਾਧੂ ਵਿਰੋਧੀ ਟੈਸਟਾਂ ਦੇ ਕਾਰਨ ਹਨ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, GPT4 ਜ਼ਿਆਦਾਤਰ ਮਨੁੱਖੀ ਦੁਆਰਾ ਲਈਆਂ ਗਈਆਂ ਅਕਾਦਮਿਕ ਅਤੇ ਪੇਸ਼ੇਵਰ ਪ੍ਰੀਖਿਆਵਾਂ ਵਿੱਚ CPT-3.5 ਨੂੰ ਪਛਾੜਦਾ ਹੈ। ਖਾਸ ਤੌਰ 'ਤੇ, GPT4 ਨੇ GPT-90 ਦੇ ਮੁਕਾਬਲੇ ਯੂਨੀਫਾਰਮ ਬਾਰ ਪ੍ਰੀਖਿਆ 'ਤੇ 3.5ਵੇਂ ਪਰਸੈਂਟਾਈਲ ਵਿੱਚ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤੇ, ਜੋ 10ਵੇਂ ਪਰਸੈਂਟਾਈਲ ਵਿੱਚ ਸਕੋਰ ਕਰਦਾ ਹੈ। GPT4 ਰਵਾਇਤੀ ਭਾਸ਼ਾ ਮਾਡਲ ਬੈਂਚਮਾਰਕਾਂ ਅਤੇ ਹੋਰ SOTA ਮਾਡਲਾਂ (ਭਾਵੇਂ ਕਿ ਕਈ ਵਾਰ ਤੰਗ ਕਰਕੇ) 'ਤੇ ਆਪਣੇ ਪੂਰਵਗਾਮੀ ਨੂੰ ਵੀ ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ ਪਛਾੜਦਾ ਹੈ।

GPT4 ਬਨਾਮ ChatGPT: ਅੰਤਰ ਅਤੇ ਸੀਮਾਵਾਂi

ChatGPT ਅਤੇ GPT4 ਦੋਵਾਂ ਦੀਆਂ ਮਹੱਤਵਪੂਰਨ ਸੀਮਾਵਾਂ ਅਤੇ ਜੋਖਮ ਹਨ। GPT-4 ਸਿਸਟਮ ਸ਼ੀਟ ਵਿੱਚ ਓਪਨਏਆਈ ਦੁਆਰਾ ਕਰਵਾਏ ਗਏ ਜੋਖਮਾਂ ਦੀ ਵਿਸਤ੍ਰਿਤ ਖੋਜ ਤੋਂ ਜਾਣਕਾਰੀ ਸ਼ਾਮਲ ਹੈ।

ਇਹ ਦੋਵੇਂ ਮਾਡਲਾਂ ਨਾਲ ਜੁੜੇ ਕੁਝ ਜੋਖਮ ਹਨ:

  • ਭੁਲੇਖੇ (ਬੇਤੁਕੇ ਜਾਂ ਅਸਲ ਵਿੱਚ ਗਲਤ ਸਮੱਗਰੀ ਪੈਦਾ ਕਰਨ ਦੀ ਪ੍ਰਵਿਰਤੀ)
  • ਹਾਨੀਕਾਰਕ ਸਮੱਗਰੀ ਤਿਆਰ ਕਰੋ ਜੋ OpenAI ਨੀਤੀਆਂ ਦੀ ਉਲੰਘਣਾ ਕਰਦੀ ਹੈ (ਉਦਾਹਰਨ ਲਈ ਨਫ਼ਰਤ ਭਰਿਆ ਭਾਸ਼ਣ, ਹਿੰਸਾ ਲਈ ਉਕਸਾਉਣਾ)
  • ਹਾਸ਼ੀਏ 'ਤੇ ਪਏ ਲੋਕਾਂ ਦੀਆਂ ਰੂੜ੍ਹੀਆਂ ਨੂੰ ਵਧਾਓ ਅਤੇ ਕਾਇਮ ਰੱਖੋ
  • ਧੋਖਾ ਦੇਣ ਦੇ ਇਰਾਦੇ ਨਾਲ ਯਥਾਰਥਵਾਦੀ ਗਲਤ ਜਾਣਕਾਰੀ ਪੈਦਾ ਕਰੋ

ਜਦੋਂ ਕਿ ChatGPT ਅਤੇ GPT-4 ਇੱਕੋ ਜਿਹੀਆਂ ਸੀਮਾਵਾਂ ਅਤੇ ਜੋਖਮਾਂ ਨਾਲ ਸੰਘਰਸ਼ ਕਰਦੇ ਹਨ, ਓਪਨਏਆਈ ਨੇ GPT-4 ਲਈ ਉਹਨਾਂ ਨੂੰ ਘੱਟ ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰੇ ਵਿਰੋਧੀ ਟੈਸਟਾਂ ਸਮੇਤ ਵਿਸ਼ੇਸ਼ ਯਤਨ ਕੀਤੇ ਹਨ। ਹਾਲਾਂਕਿ ਇਹ ਉਤਸ਼ਾਹਜਨਕ ਹੈ, GPT-4 ਸਿਸਟਮ ਸ਼ੀਟ ਆਖਰਕਾਰ ਇਹ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ ਚੈਟਜੀਪੀਟੀ ਕਿੰਨੀ ਕਮਜ਼ੋਰ ਸੀ (ਅਤੇ ਸ਼ਾਇਦ ਅਜੇ ਵੀ ਹੈ)। ਹਾਨੀਕਾਰਕ ਅਣਇੱਛਤ ਨਤੀਜਿਆਂ ਦੀ ਵਧੇਰੇ ਵਿਸਤ੍ਰਿਤ ਵਿਆਖਿਆ ਲਈ, ਮੈਂ GPT-4 ਸਿਸਟਮ ਸ਼ੀਟ ਨੂੰ ਪੜ੍ਹਨ ਦੀ ਸਿਫ਼ਾਰਸ਼ ਕਰਦਾ ਹਾਂ, ਜੋ ਕਿ ਦੇ ਪੰਨਾ 38 ਤੋਂ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ। GPT-4 ਤਕਨੀਕੀ ਰਿਪੋਰਟ .

ਸਿੱਟਾ

ਜਦੋਂ ਕਿ ਅਸੀਂ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ, ਅਤੇ GPT4 ਦੇ ਪਿੱਛੇ ਸਿਖਲਾਈ ਦੇ ਤਰੀਕਿਆਂ ਬਾਰੇ ਬਹੁਤ ਘੱਟ ਜਾਣਦੇ ਹਾਂ, ਉੱਥੇ ChatGPT ਦਾ ਇੱਕ ਸ਼ੁੱਧ ਸੰਸਕਰਣ ਜਾਪਦਾ ਹੈ। ਅਸਲ ਵਿੱਚ, ਵਰਤਮਾਨ ਵਿੱਚ GPT4 ਚਿੱਤਰਾਂ ਅਤੇ ਟੈਕਸਟ ਇਨਪੁਟ ਨੂੰ ਸਵੀਕਾਰ ਕਰਨ ਦੇ ਯੋਗ ਹੈ, ਅਤੇ ਨਤੀਜੇ ਸੁਰੱਖਿਅਤ, ਵਧੇਰੇ ਸਹੀ ਅਤੇ ਵਧੇਰੇ ਰਚਨਾਤਮਕ ਹਨ। ਬਦਕਿਸਮਤੀ ਨਾਲ, ਸਾਨੂੰ ਇਸਦੇ ਲਈ OpenAI ਦੇ ਸ਼ਬਦ ਨੂੰ ਲੈਣਾ ਪਵੇਗਾ, ਕਿਉਂਕਿ GPT4 ਸਿਰਫ ChatGPT ਪਲੱਸ ਗਾਹਕੀ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਉਪਲਬਧ ਹੈ।

ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰਗਤੀ, ਜੋਖਮਾਂ ਅਤੇ ਸੀਮਾਵਾਂ ਬਾਰੇ ਸੂਚਿਤ ਰਹਿਣਾ ਜ਼ਰੂਰੀ ਹੈ ਕਿਉਂਕਿ ਅਸੀਂ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੇ ਇਸ ਦਿਲਚਸਪ ਪਰ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਤ ਹੋ ਰਹੇ ਲੈਂਡਸਕੇਪ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰਦੇ ਹਾਂ।

BlogInnovazione.it

ਤੁਹਾਨੂੰ ਵੀ ਦਿਲਚਸਪੀ ਹੋ ਸਕਦੀ ਹੈ

ਇਨੋਵੇਸ਼ਨ ਨਿਊਜ਼ਲੈਟਰ
ਨਵੀਨਤਾ ਬਾਰੇ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਖ਼ਬਰਾਂ ਨੂੰ ਨਾ ਭੁੱਲੋ। ਉਹਨਾਂ ਨੂੰ ਈਮੇਲ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਸਾਈਨ ਅੱਪ ਕਰੋ।

ਤਾਜ਼ਾ ਲੇਖ

ਬੱਚਿਆਂ ਲਈ ਰੰਗਦਾਰ ਪੰਨਿਆਂ ਦੇ ਲਾਭ - ਹਰ ਉਮਰ ਲਈ ਜਾਦੂ ਦੀ ਦੁਨੀਆ

ਰੰਗਾਂ ਰਾਹੀਂ ਵਧੀਆ ਮੋਟਰ ਹੁਨਰਾਂ ਦਾ ਵਿਕਾਸ ਕਰਨਾ ਬੱਚਿਆਂ ਨੂੰ ਲਿਖਣ ਵਰਗੇ ਹੋਰ ਗੁੰਝਲਦਾਰ ਹੁਨਰਾਂ ਲਈ ਤਿਆਰ ਕਰਦਾ ਹੈ। ਰੰਗ ਕਰਨ ਲਈ…

2 ਮਈ 2024

ਭਵਿੱਖ ਇੱਥੇ ਹੈ: ਸ਼ਿਪਿੰਗ ਉਦਯੋਗ ਗਲੋਬਲ ਆਰਥਿਕਤਾ ਵਿੱਚ ਕਿਵੇਂ ਕ੍ਰਾਂਤੀ ਲਿਆ ਰਿਹਾ ਹੈ

ਜਲ ਸੈਨਾ ਖੇਤਰ ਇੱਕ ਸੱਚੀ ਗਲੋਬਲ ਆਰਥਿਕ ਸ਼ਕਤੀ ਹੈ, ਜਿਸ ਨੇ 150 ਬਿਲੀਅਨ ਮਾਰਕੀਟ ਵੱਲ ਨੈਵੀਗੇਟ ਕੀਤਾ ਹੈ...

1 ਮਈ 2024

ਪ੍ਰਕਾਸ਼ਕ ਅਤੇ ਓਪਨਏਆਈ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਦੁਆਰਾ ਸੰਸਾਧਿਤ ਜਾਣਕਾਰੀ ਦੇ ਪ੍ਰਵਾਹ ਨੂੰ ਨਿਯਮਤ ਕਰਨ ਲਈ ਸਮਝੌਤਿਆਂ 'ਤੇ ਹਸਤਾਖਰ ਕਰਦੇ ਹਨ

ਪਿਛਲੇ ਸੋਮਵਾਰ, ਫਾਈਨੈਂਸ਼ੀਅਲ ਟਾਈਮਜ਼ ਨੇ ਓਪਨਏਆਈ ਨਾਲ ਇੱਕ ਸੌਦੇ ਦਾ ਐਲਾਨ ਕੀਤਾ। FT ਆਪਣੀ ਵਿਸ਼ਵ ਪੱਧਰੀ ਪੱਤਰਕਾਰੀ ਨੂੰ ਲਾਇਸੰਸ ਦਿੰਦਾ ਹੈ...

30 ਅਪ੍ਰੈਲ 2024

ਔਨਲਾਈਨ ਭੁਗਤਾਨ: ਇੱਥੇ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਕਿਵੇਂ ਸਟ੍ਰੀਮਿੰਗ ਸੇਵਾਵਾਂ ਤੁਹਾਨੂੰ ਹਮੇਸ਼ਾ ਲਈ ਭੁਗਤਾਨ ਕਰਦੀਆਂ ਹਨ

ਲੱਖਾਂ ਲੋਕ ਸਟ੍ਰੀਮਿੰਗ ਸੇਵਾਵਾਂ ਲਈ ਭੁਗਤਾਨ ਕਰਦੇ ਹਨ, ਮਹੀਨਾਵਾਰ ਗਾਹਕੀ ਫੀਸ ਅਦਾ ਕਰਦੇ ਹਨ। ਇਹ ਆਮ ਰਾਏ ਹੈ ਕਿ ਤੁਸੀਂ…

29 ਅਪ੍ਰੈਲ 2024

ਆਪਣੀ ਭਾਸ਼ਾ ਵਿੱਚ ਇਨੋਵੇਸ਼ਨ ਪੜ੍ਹੋ

ਇਨੋਵੇਸ਼ਨ ਨਿਊਜ਼ਲੈਟਰ
ਨਵੀਨਤਾ ਬਾਰੇ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਖ਼ਬਰਾਂ ਨੂੰ ਨਾ ਭੁੱਲੋ। ਉਹਨਾਂ ਨੂੰ ਈਮੇਲ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਸਾਈਨ ਅੱਪ ਕਰੋ।

ਸਾਡੇ ਨਾਲ ਪਾਲਣਾ