Z tego powodu, że android jest systemem przeznaczonym dla wszystkich języków, obsługuje on kodowanie znaków wg standardów ASCII (polskie znaki to też ASCII), ale wykorzystuje w tym celu kilka standardów. Dlatego w momencie kiedy użyjesz znaku nie wchodzącego w skład podstawowego UTF, to system zapisuje przed każdym znakiem jego standard (w przeciwieństwie do nokii (tych gorszych), która wydana na dany region może obsługiwać znaki tylko z jednego standardu). Niektóre nokie z symbianem mają możliwość wyboru sposobu kodowania znaków - uproszczony (jeden standard) bądź rozszerzony (wszystkie dostępne w telefonie)
Stąd możesz w jednym SMS'ie używać zarówno znaków polski, niemieckich czy francuskich itd, itp, co w telefonach, które mają jeden standard, jest nie możliwe. Większość telefonów z systemami operacyjnymi koduje teraz znaki w rozszerzonym formacie.
Coś ostro pomieszałeś :-) Nie jestem specem w dziedzinie, ale:
standard ASCII jest tylko jeden, nie ma kilku
nie zawiera on nie tylko polskich, ale żadnych regionalnych znaków. Jeśli coś ma obsługę wielu języków, to znaczy właśnie ni mniej, ni więcej, że nie może korzystać z ASCII (przynajmniej nie z czystego - większość standardów międzynarodowych jest nadbudową na ASCII, więc pośrednio się z niego zawsze korzysta)
SMSy nie są wysyłane zwyczajnym ASCII, a jego drobną przeróbką - Google twierdzi, że to się nazywa GSM 03.38
UTF za bardzo "podstawowy" to nie jest, zawiera wszelkie współczesne oraz starożytne alfabety świata, czy np. alfabet Klingoński. Raczej nie masz szans użycia znaku nie wchodzącego w skład UTF.
znaki wcale nie są poprzedzane informacją o kodowaniu. Po prostu w unicodzie każdy znak zajmuje dwa bajty i tyle.
cała gadka o telefonach obsługujących lub nie dany standard jest pozbawiona sensu. Przecież SMSów nie wysyłamy do samych siebie, a do kogoś, więc co, gdyby odbiorca nie obsługiwał "rozszerzonego" standardu? Właśnie cały problem polega na tym, że wciąż trzymamy zgodność z prehistorią i stąd takie problemy. Gdyby olać stare komórki i standardy, zrobić nowocześnie, to w tych 160 bajtach byśmy mogli spokojnie zmieścić ze 130 znaków międzynardowych, a nie 70 (no i można by jeszcze tekst skompresować).