Конвертировать UTF-8 encoded NSData в NSString


У меня кодировка UTF-8 NSData из windows server и я хочу преобразовать его в NSString для iPhone. Поскольку данные содержат символы (например, символ степени), которые имеют разные значения на обеих платформах,как преобразовать данные в строку?

6 548

6 ответов:

если данные не завершаются нулем, вы должны использовать -initWithData:encoding:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];

если данные завершаются нулем, вы должны вместо этого использовать -stringWithUTF8String: чтобы избежать лишних в конце.

NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];

(обратите внимание, что если вход не правильно закодирован UTF-8, вы получите nil.)


Swift вариант:

let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.

если данные завершены нулем, вы можете пойти безопасным путем, который удаляет этот нулевой символ или небезопасный способ похож на версию Objective-C выше.

// safe way, provided data is -terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is -terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))

вы можете вызвать этот метод

+(id)stringWithUTF8String:(const char *)bytes.

Я смиренно представляю категорию, чтобы сделать это менее раздражающим:

@interface NSData (EasyUTF8)

// Safely decode the bytes into a UTF8 string
- (NSString *)asUTF8String;

@end

и

@implementation NSData (EasyUTF8)

- (NSString *)asUTF8String {
    return [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];    
}

@end

(обратите внимание, что если вы не используете ARC, вам понадобится autorelease там.)

теперь вместо ужасающе многословен:

NSData *data = ...
[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];

вы можете сделать:

NSData *data = ...
[data asUTF8String];

версия Swift от строки к данным и обратно к строке:

Xcode 9 * Swift 4

extension Data {
    var string: String {
        return String(data: self, encoding: .utf8) ?? ""
    }
}
extension String {
    var data: Data {
        return Data(utf8)
    }
    var base64Decoded: Data? {
        return Data(base64Encoded: self)
    }
}

детская площадка

let string = "Hello World"                                  // "Hello World"
let stringData = string.data                                // 11 bytes
let base64EncodedString = stringData.base64EncodedString()  // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string                      // "Hello World"

let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded {
    print(data)                                    //  11 bytes
    print(data.base64EncodedString())              // "SGVsbG8gV29ybGQ="
    print(data.string)                             // "Hello World"
}

let stringWithAccent = "Olá Mundo"                          // "Olá Mundo"
print(stringWithAccent.count)                               // "9"
let stringWithAccentData = stringWithAccent.data            // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string  // "Olá Mundo\n"

иногда методы в других ответах не работают. В моем случае я создаю подпись с моим закрытым ключом RSA, и результатом является NSData. Я обнаружил, что это, кажется, работает:

С

NSData *signature;
NSString *signatureString = [signature base64EncodedStringWithOptions:0];

Свифт

let signatureString = signature.base64EncodedStringWithOptions(nil)

В общем, вот полный ответ, который работал для меня.

моя проблема была в том, что когда я использовал

[NSString stringWithUTF8String:(char *)data.bytes];

строка, которую я получил, была непредсказуемой: около 70% она содержала ожидаемое значение, но слишком часто это приводило к Null или еще хуже: одетый в конце строки.

после некоторого рытья я переключился на

[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];

и получил ожидаемый результат каждый раз.